
Проведення розрахунків напружено-деформованого стану стає дедалі складнішим завданням. Зі зростанням розмірів і складності моделей — з нелінійною поведінкою матеріалі в, контактними взаємодіями та пов'язаною фізикою — традиційні обчислювальні ресурси часто стають обмежувальним фактором. Інженери стикаються з тривалим часом обчислення, вузькими місцями в пам'яті та проблемами збіжності, що безпосередньо впливає на терміни проектів та цикли ітерацій проєктування.
Ansys Mechanical 2025 R2 представив кілька вдосконалень у сфері високопродуктивних обчислень (HPC) та вирішувача, призначених для подолання цих проблем. Наприклад, у версії 2025 R2 додано підтримку теплового аналізу у змішаному вирішувачі, а ітераційний вирішувач PCG тепер споживає значно менше пам'яті, особливо при великій кількості ядер.

Графік показує зменшення пікового споживання пам'яті PCG-вирішувачем від Ansys 2024 R2 до 2025 R2, порівнюючи різні кількості ядер (тест V24iter-3, 25M ступенів свободи, модальний аналіз із використанням PCG Lanczos eigensolver, що запитує 10 форм власних коливань). Тестування проводилось на Linux-кластері з обчислювальними вузлами, що містять два процесори Intel Xeon Gold 6448H та 1024 ГБ оперативної пам'яті.
Забезпечуючи гібридний паралелізм та архітектуру змішаного вирішувача, представлену у 2025 R1, Ansys дає змогу користувачам розв'язувати задачі з більшими моделями швидше та ефективніше, зменшуючи використання пам'яті та розширюючи апаратну сумісність.
Гібридний паралелізм покращує використання ресурсів процесора
Гібридний паралелізм у програмному забезпеченні Mechanical інтегрує паралелізм зі спільною пам'яттю (SMP) та паралелізм з розподіленою пам'яттю (DMP), дозволяючи користувачам тонко налаштовувати моделювання на основі доступного обладнання. У той час як потоки SMP виконуються на одному вузлі, DMP розподіляє процеси між кількома вузлами за допомогою Message Passing Interface (MPI). У гібридному режимі інженери можуть встановити кількість MPI-процесів та потоків на процес (наприклад, 16 MPI-процесів з NT=2 на 32-ядерному вузлі), щоб збалансувати використання пам'яті та обчислювальну пропускну здатність.
Ця конфігурація особливо корисна для великомасштабних моделей методом кінцевих елементів. Наприклад, розрахунки, що включають понад 100 мільйонів ступенів свободи (DOF), можуть працювати повністю в оперативній пам'яті, без підкачки, за рахунок оптимізації розподілу потоків/процесів. Гібридна установка зменшує обсяг пам'яті на процес та покращує масштабованість при роботі на кількох вузлах.

Гібридний паралелізм покращує масштабованість та зменшує вимоги до пам'яті у великих розрахунках. Цей приклад із моделлю блоку двигуна (див. перше зображення). показує, як збільшення потоків на процес (NT=2, NT=4) зменшує використання пам'яті, що забезпечує ефективніше використання ядер процесора.
У Ansys 2025 R2 конфігурація вирішувача залишається доступною через інтерфейс Mechanical або безпосередньо через Mechanical APDL (MAPDL) за допомогою розширених налаштувань запуску. Це полегшує досвідченим користувачам налаштування продуктивності на різних апаратних топологіях.
Архітектура змішаного вирішувача покращує швидкість та ефективність моделювання
Змішаний вирішувач поєднує прямий розріджений (sparse direct) та ітераційний PCG вирішувачі в єдиний, гібридний обчислювальний шлях, що охоплює як центральний процесор, так і графічний процесор. Ця архітектура динамічно балансує стратегії вирішення на основі характеристик моделі та апаратної конфігурації. Вона використовує арифметику подвійної та одинарної точності на центральному та графічному процесорах для покращеної продуктивності та ефективності використання пам'яті.
Цей підхід особливо ефективний для нелінійних статичних та перехідних розрахунків, що включають пластичність, повзучість, геометричну нелінійність та великі набори контактів. І ці переваги не обмежуються високопродуктивними головними процесорами – у нещодавніх тестах економічно графічний процесор NVIDIA RTX A6000 Ada досяг продуктивності, порівнянної з процесорами для центрів обробки даних H100, на моделі блоку двигуна з 4M DOF (див. перше зображення).

На графіку представлено порівняння продуктивності змішаного вирішувача для нелінійного статичного розрахунку моделі блоку двигуна (див. перше зображення, приблизно 4,1 мільйона ступенів свободи), що включає пластичність, геометричні нелінійності та контакти. Тестування проводилося за допомогою Ansys Mechanical 2025 R1 на Linux-сервері (2× Intel Xeon Gold 6342, 1 ТБ RAM, SSD, RHEL 8.9) з 16 ядрами ЦП (DMP) та 1 графічним процесором NVIDIA H100 NVL або RTX A6000 Ada.
Оцінка рентабельності інвестицій від прискорення розрахунків
Окрім переваг у продуктивності, вдосконалення вирішувачів та HPC також призводять до певної фінансової вигоди. Недавнє незалежне дослідження Hyperion Research показало, що:
- Кожен $1, витрачений на інфраструктуру HPC, приносить $152 доходу.
- Кожен долар також сприяв $35 прямої економії витрат або прибутку.

Ці цифри підкреслюють доцільність інвестування в масштабовані ресурси для розрахунків, як на місці, так і в хмарі.
Гнучкі варіанти розгортання HPC допомагають підлаштовуватись до зміни потреб
Ansys підтримує широкий спектр варіантів розгортання HPC, щоб відповідати потребам користувачів на будь-якому етапі розрахунку. Для багатьох шлях починається скромно, з локальних ресурсів — ноутбуків, настільних ПК або готових HPC-систем — і розширюється зі зростанням складності розрахунку.
Для додаткової гнучкості та масштабованості Ansys пропонує кілька хмарних HPC-рішень:
- Ansys Cloud Burst Compute надає безпечні, високопродуктивні обчислення на вимогу з інтегрованими хмарними інструментами для моделювання.
- Ansys Access на Microsoft Azure дозволяє користувачам запускати розрахунки, використовуючи власні ліцензії через гнучку підписку на Azure Marketplace.
- Ansys Gateway powered by AWS дозволяє створювати повністю налаштовуванні хмарні середовища, доступні з будь-якого браузера, і підтримує як інструменти Ansys, так і сторонні інструменти.
Найкращі способи збільшення продуктивності з HPC
Щоб повністю використати вказані вище переваги, кінцевим користувачам слід дотримуватися кількох ключових технічних найкращих практик:
- Оцінюйте вирішувачі PCG, sparse та mixed на основі розміру задачі, умов контакту та доступної пам'яті.
- Використовуйте гібридні конфігурації з оптимізованою кількістю потоків, щоб мінімізувати ефекти NUMA та максимізувати використання пропускної здатності пам'яті.
- Увімкніть автоматичне розбиття контакту для покращення збіжності та зменшення ітерацій вирішувача в моделях з домінуючим контактом.
- Переконайтеся, що канали пам'яті повністю заповнені. Використовуйте SSD або сховище RAID 0 для швидкого читання/запису та використовуйте прискорення з GPU, де це можливо.
- Контролюйте коефіцієнт балансу навантаження елементів та статистику вирішувача, щоб виявити неефективність і точно налаштувати розміри кроків, допуски та параметри декомпозиції.
Звертайтесь до компанії Софт Інжиніринг Груп
Бажаєте застосувати кращі практики у своїх розробках? Тоді звертайтеся до нас. Фахівці компанії Софт Інжиніринг Груп допоможуть придбати та навчитись ефективно використовувати програмне забезпечення та нададуть технічну підтримку.
Title: Discover Best Practices To Accelerate Ansys Mechanical Simulations
Author: Ansys
Website Name: www.ansys.com
URL: https://www.ansys.com/blog/discover-best-practices-to-accelerate-ansys-mechanical-simulations




