Научный журнал «Инновации. Наука. Образование» Индексация в ринц н Инновации. Наука. Образование



Pdf көрінісі
бет879/918
Дата24.05.2022
өлшемі22,11 Mb.
#144828
1   ...   875   876   877   878   879   880   881   882   ...   918
Байланысты:
Номер 51 февраль 2022 года

Инновации. Наука. Образование 
мощностей одного такого сервера не хватает и приходится использовать локальную сеть 
[4, c.289]. Этот процесс дорогой и трудозатратный. К тому же он относительно 
медленный, так как локальная сеть не дает нужной пропускной способности и по этой 
причине при расчетах бывают ошибки. Использование графических процессоров 
значительно увеличивает скорость обработки данных, а также, снижает стоимость 
вычислительных серверов. Серверное решение Tesla не может полностью заменить 
обычный универсальный процессор, но позволяет использовать вычислительный ресурс 
множества своих ядер (вести независимую параллельную обработку данных) для решения 
определенного круга ресурсоемких задач.
На практике предел доступного параллелизма может быть непозволительно 
низким при работе в системах на основе GPU. Эти ограничения численные. 
Следовательно, классические оптимизации кода (например, переупорядочение циклов, 
сокращение доступа к памяти, улучшения асинхронной связи) не смогут обойти это 
базовое масштабирование. Однако, например, случайный лучевой метод переноса 
нейтральных частиц — многообещающий новый метод высокоточного моделирования 
ядерных реакторов, до сих пор его можно было эффективно масштабировать на 
суперкомпьютерах на базе CPU текущего поколения. Однако существуют 
фундаментальные численные ограничения на количество доступного параллелизма в 
случайном луче из-за использования приближения «мертвой зоны». На практике 
оказывается, что эти ограничения сильно снижают производительность систем на базе 
графических процессоров. 
Проблемы производительности графического процессора двояки и представляют 
собой две стороны одной медали: эффективное выполнение относительно небольших 
задач на отдельных графических процессорах и сильное масштабирование больших задач 
(фиксированного размера) на массивные кластеры графических процессоров. В обоих 
случаях открытый параллелизм на узле недостаточен для эффективного использования 
архитектур типа GPU. Преодолеть это препятствие невозможно с помощью классических 
алгоритмических или программных методов оптимизации, скорее, требуется 
фундаментальная численная переформулировка метода, чтобы обеспечить массовый 
параллелизм, необходимый для графических процессоров. 
Таким образом, представленная компанией NVIDIA архитектура Maxwell 
показывает серьезные преимущества по сравнению с архитектурами предыдущего 
поколения. Любой человек, нуждающийся в использовании параллельных вычислений, 


957 
Научный журнал «Инновации. Наука. Образование» 
Индексация в РИНЦ 
н 


Достарыңызбен бөлісу:
1   ...   875   876   877   878   879   880   881   882   ...   918




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет