|
15.01.2020, 12:38 | #1 |
Участник
|
DAX2009 забирает всю память
Проблема следующая. Процесс Ax32Serv.exe постепенно съедает всю имеющуюся на сервере память, около 32 Гб. В течение нескольких дней это происходит. Приходится из-за этого периодически перезапускать АОС, только это помогает освободить память.
Причем происходит это только на основном АОСе. Есть также и пакетный АОС, соответственно физически на другой машине, и там ничего не уходит. И главное что не особенно какие-то мощные задачи у нас работают, функциональная область охвачена небольшая, пользователей умеренное количество, непонятно вообще на что грешить. Единственное что код свой в основном, возможно где-то что не оптимально разрабатывали, но пока не можем понять что Есть ли какая-то методология, подходы, по шагам, как выявить откуда эта проблема идёт? Нас двое человек по AX, но мы чисто программеры, и все эти вопросы где уже идёт взаимодействие с операционной системой, к сожалению нет у нас этих компетенций. Админы наши по AX имеют также самое общее понимание, необходимое для того чтоб всё работало. Поэтому без советов опытных людей мы тут не решим, без вариантов. Очень прошу посоветуйте кто что знает. Думаю есть кто также сталкивались с такой ситуацией. Может просто по ссылкам по рекомендуете какие-то вещи изучить. Любая полезная информация подойдёт. Потому что пока даже не понимаем с какого бока подступиться. |
|
15.01.2020, 13:03 | #2 |
Участник
|
для начала проверьте размер глобального кэша на сервере
Поговорим о глобальных кэшах в Аксапте? Как правильно? |
|
|
За это сообщение автора поблагодарили: FrolovAndy (1). |
16.01.2020, 11:01 | #3 |
Участник
|
Цитата:
Сообщение от mazzy
для начала проверьте размер глобального кэша на сервере
Поговорим о глобальных кэшах в Аксапте? Как правильно? Я попробовал тупо с помощью джоба оценить, пробежался по Infolog.globalCache(), appl, и classFactory, посмотрел что там лежит, закэшировано совсем немного, и главное что со временем содержание не меняется. Похоже активного использования нет. Или есть какой-то более грамотный способ оценки размера глобального кэша? Последний раз редактировалось FrolovAndy; 16.01.2020 в 11:05. |
|
15.01.2020, 13:15 | #4 |
Участник
|
А есть поддержка в MS? Можно завести тикет, они научат собирать дамп AOS, там можно будет посмотреть какая операция заняла столько памяти. Возможно, есть описание сбора дампа и в открытом доступе, уже не помню про 2009.
__________________
Ivanhoe as is.. |
|
|
За это сообщение автора поблагодарили: FrolovAndy (1). |
15.01.2020, 13:34 | #5 |
Участник
|
|
|
15.01.2020, 14:05 | #6 |
Участник
|
Вендор перестает саомтоятельно делать фиксы (хотя в некоторых случаях выпускает), но остальную поддержку никто не отменял.
__________________
Ivanhoe as is.. |
|
16.01.2020, 11:04 | #7 |
Участник
|
Цитата:
Скорее всего придется самостоятельно, штат тут уже несколько раз сменился, концов не найти, даже неизвестно есть ли тут какая-то поддержка. Но очень надеюсь что удастся найти инфу про сбор дампа |
|
16.01.2020, 12:03 | #8 |
Участник
|
|
|
|
За это сообщение автора поблагодарили: FrolovAndy (1). |
16.01.2020, 12:16 | #9 |
Участник
|
|
|
15.01.2020, 14:34 | #10 |
Участник
|
Была точно такая же проблема лет десять назад, помню что помогла установка более старшей версии Ax32serv.exe, информация о таком варианте решения была получена от партнера (КК). Спросите вашего партнера, возможно для них это уже известный случай.
|
|
16.01.2020, 11:23 | #11 |
Участник
|
Я про поддержку Microsoft. Если вы оплачиваете подписку, то у вас она есть. Если нет - ищите про дампы. Если АОС именно кушает память, 95% что это не корректная доработка. Как выше уже написали, стоит для начала обновить kernel до последнего рекомендуемого, ищите тут же на форуме (ну и скачать можно будет опять же при наличии подписки).
__________________
Ivanhoe as is.. |
|
16.01.2020, 12:04 | #12 |
Участник
|
|
|
16.01.2020, 12:14 | #13 |
Участник
|
Цитата:
Пробовал такую же тему с темповыми таблицами, но тоже потом всё чистится То есть тут что-то забирает память и потом не освобождает. Есть еще мысли что кэширование записей кривое, например неправильно сделали CacheLookup. Это тоже попробуем поискать |
|
16.01.2020, 12:09 | #14 |
Участник
|
Как выяснилось, поддержки у нас нет сто процентов, сейчас специально поузнавал у ребят, оказывается у них когда-то уже была идея в MS обратиться по этому поводу, но именно из-за отсутствия поддержки не смогли
Так что будем пока с дампом работать. Вообще очень похоже что проблема вызывается узким кругом лиц, может быть даже конкретным пользователем (точнее криво написанным кодом, который именно этим человеком используется). Потому что характер прироста памяти очень нелинейный. В течение дня в какие-то периоды очень сильно растет, а в остальные вяло увеличивается. В выходные не увеличивается. Будем пытаться как-то через это тоже искать решение |
|
16.01.2020, 12:13 | #15 |
Участник
|
MS нужен был для помощи с дампом. Выше уже привели ссылку, сможете и сами. Там будет видно стек вызовов, пользователя. Исходя из этого найдете свою доработку.
__________________
Ivanhoe as is.. |
|
17.01.2020, 15:20 | #16 |
Участник
|
Итак, по дампу...
Я вообще понял исходя из информации по ссылке, что речь идет о ситуации когда АОС по непонятным причинам валится, и для этого предлагается добиться образования дампа на момент падения, и дальше по стеку вызовов в нем уже отмотать до информации о том что это падение вызвало. Так? У меня просто иная ситуация. Ничего как таковое не падает. Точнее в потенциале наверное таки и упадет если АОС вовремя не рестартовывать. Но идея в другом. Тут надо понять именно не момент в который что-то падает, а выяснить что так влияет на утечку памяти. Ну я пробовал всяко-разно пытаться действовать хотя бы согласно указанной информации. Дамп собрал просто на текущем работающем процессе, открыл в WinDbg, ну и уже после выполнения команды kp понимаю что не знаю как дальше действовать. В разбираемом примере указывается конкретный фрейм, по которому и определяется всё остальное, в моём случае такого фрейма нет, и вообще информация выходит менее осмысленная. Я так понял что это тоже про AOS crash, т.е. не про мой случай Есть идеи, советы, что я могу полезного с помощью windbg вытащить? почитал его описание команд, понял что надо первоначально знать какие шаги выполнять, методология что ли какая-то... Короче, что там можно сделать? уже мозг кипит ) |
|
17.01.2020, 17:02 | #17 |
Участник
|
Цитата:
это уровень ядра и C++. все равно на этом уровне вы ничего сделать не сможете, только версию ядра обновить (обновите exe-шники по-любому) бизнес-логика аксапты находится на уровне Java виртуальной машины (JVM) JVM в аксапте была форкнута очень давно. там версия Java максимум 2-3. Точно меньше Java 6. Поэтому вам нужно копать проблемы старенькой Java. Прежде всего сборщик мусора (GC) В Java память не "течет". В Java "память не освобождается сборщиком мусора". В стареньких Java сборщик мусора прибирает объект, если на него нет ссылок из других объектов. следовательно вам нужно искать: 1. объекты, на которые ссылаются глобальные "вечноживущие" объекты: GlobalCache, Infolog, Appl и другие 2. объекты, которые образуют нетривиальное кольцо (кольцо, в котором больше двух объектов) - самосвязанные списки, самозамкнутые мапы и прочее. Причем эти объекты не помечаются как dead. В общем, читать про достижимые и мертвые объекты в java Я читал ваше утверждение что ваш GlobalCache маленький Но проверьте себя еще раз. Вы точно читали кэш СЕРВЕРА, а не клиента? среди закэшированных объектов нет каких-нибудь map'ов, которые содержат record? например, так стандартный функционал корпоративного портала хранит в GlobalCache картинки. Влегкую. если GlobalCache на СЕРВЕРЕ действительно не содержит объемных данных, то остается искать недостижимые для сборщика мусора мертвые объекты в ваших модификациях. и класс SysHeapLog вам в помощь. Последний раз редактировалось mazzy; 17.01.2020 в 17:20. |
|
|
За это сообщение автора поблагодарили: FrolovAndy (1), Товарищ ♂uatr (2). |
20.01.2020, 08:52 | #18 |
Участник
|
Цитата:
Цитата:
JVM в аксапте была форкнута очень давно.
Еще есть сложность с распределенной сборкой мусора - клиент может хранить ссылку на объект на сервере и может быть распределенный цикл, который собирается как-то очень нетривиально и долго. В Ax2012, ЕМНИП, специально устраняли такие ссылки. Я не очень знаю, как при помощи WinDBG исследовать unmanaged память, но я знаю что, по крайней мере, в Dyn365FO есть performance counters для количества объектов, сборок мусора и так далее. Может быть что-то такое есть и в 2009 и оно как-то поможет в исследовании проблемы. В доке по 2012, впрочем, я их не вижу |
|
17.01.2020, 19:14 | #19 |
Участник
|
Спасибо огромное за содержательный ответ, и за то что пишете на очень понятном языке! Очень хорошо выделены основные принципы
Большое облегчение честно говоря что не надо шаманить с дампом. Глобальный кэш я именно на сервере смотрел, то есть вызовы *.globalCache() делались из кода исполняющегося на сервере. Ну разве что classFactory.globalCache() я смотрел и там и там, читал на форуме такой совет что его надо на обоих звеньях анализировать Вот, просмотрел полностью, разбирая все сложные объекты в том числе и мапы в мапах, и не считая пары контейнеров с 400 числами ничего мощного там не было. Я почему и спросил нет ли каких-то альтернативных способов оценки глобального кэша, т.к. я просто перебирал содержимое и всё, это не дало ничего настораживающего Сосредоточу всё свое внимание на том что вы пишете про самозамкнутые хранилища, воспользуюсь классом SysHeapLog про который до сегодняшнего дня вообще ничего не знал. Будем копать дальше! |
|
|
За это сообщение автора поблагодарили: mazzy (2). |
17.01.2020, 22:21 | #20 |
Участник
|
Подтверждаю подозрения про списки хранящие записи табличного типа. Что-то явно не чисто в системе при работе с такими динамическими структурами. Место они в памяти очень много занимают. И про сборщик мусора подтверждаю. В особо заковыристых случаях пока явно в ссылку Null не запишешь она живёт в памяти до последнего.
Были на практике такие случаи. Падает AOS при расчёте спецификации По вашей ситуации. Вы не пробовали как-то локализовать проблему? Вычислить при использовании какого именно функционала АОС начинает есть память? У вас все пользователи работают через один АОС? Можно попробовать поднять ещё один АОС и поделить между ними пользователей по функциональным задачам. Возможно удастся вычислить при работе какого функционала начинает съедается память |
|