955
Научный журнал «Инновации. Наука. Образование»
Индексация в РИНЦ
н
Инновации. Наука. Образование
вычислительных архитектур. Потребляемая мощность процессора пропорциональна,
примерно, квадрату тактовой частоты, точнее степени 2,5. То есть, процессор с тактовой
частотой 3 ГГц потребляет больше, чем 9 процессоров частотой 1 ГГц [5, c.114].
Многоядерный процессор, с
той же потребляемой энергией, будет в три раза
производительнее при исполнении параллельного кода.
Второй факт: чем большее количество потоков уже распараллелено, тем больше
вероятность, что задача может быть распараллелена на ещё большее количество потоков.
Такая ситуация типична для вычислительных задач с большими объемами данных,
которые по своей природе, в принципе, допускают параллельный алгоритм решения. А
если такого нет, то можно и не надеяться на увеличение производительности в обозримом
будущем, ибо тактовая частота современных CPU растет очень медленно. В
таких
случаях, выгодно реализовать многопоточный алгоритм, пусть он будет и на порядок
более вычислительно затратным, все равно, площади кристаллов девать некуда и, на
мультипроцессорной системе такой малоэффективный алгоритм будет работать быстрее.
Но, уже
имея задачу с тысячами потоков, можно заранее адаптировать вычислительную
архитектуру, с учетом мультипоточности, и сконцентрироваться на общей
производительности программы, а не на каждой отдельной нити,
сильно сэкономив на
многих традиционных архитектурных деталях.
Важно также, что конструировать низкочастотный процессор гораздо легче [3, с.
27]. Проще реализовать разнообразную сложную логику, так как большинство инструкций
исполняются за один такт, что упрощает планировщик выполнения инструкций и требует
меньшего количества разнообразных буферов и очередей инструкций. Это также
упрощает и делает более удобной саму ISA. (ISA — Instruction Set Architecture,
архитектура системы команд). При этом пропускная способность памяти растет гораздо
быстрее, чем уменьшается её латентность. Таким образом,
обеспечить данными
множество низкочастотных CPU гораздо проще и дешевле, чем один высокочастотный,
так как он будет часто простаивать в ожидании данных из медленной памяти. Эти факты,
взятые вместе, делают многопоточную технологию CUDA востребованной и
перспективной.
Перспективность данной технологии, также, доказывает тот факт, что видеокарты
NVIDIA используются даже в современных суперкомпьютерах, например, таких как Titan.
Для создания мощного вычислительного сервера требуется разместить в нем множество
процессоров, которые будут заниматься обработкой данных. Также,
часто бывает, что