GamesWorld : патчи файлы трейнеры софт прохождения коды nodvd

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.



Intel

Сообщений 1 страница 11 из 11

1

Intel Core 2 Duo E6850 и E8200: новое старое и старое новое

Возможно, некоторых несколько смутило название статьи, однако объясняется оно очень просто: действительно, Core 2 Duo E6850 — это последнее обновление линейки процессоров Core 2 Duo на 65-нанометровом ядре. То есть процессор — новый, но ядро — старое. В то же время Core 2 Duo E8200 работает на давно уже представленной в данной линейке частоте 2,66 ГГц, однако базируется на новом 45-нанометровом ядре. То есть частота старая, но ядро новое. Об особенностях нового ядра мы уже писали, поэтому не будем задерживать вас повторением пройденного и нудными вступлениями, а перейдём к тестам.

К сожалению, мы пока не имеем результатов тестирования Core 2 Duo E6750, который бы являлся идеальным конкурентом для E8200, поэтому мы «подпёрли» последний, с одной стороны, X6800 (тоже двухъядерный, старое ядро, но выше частота), а с другой стороны — QX6700 (та же частота, старое ядро, но ядер — четыре).

Кстати: глядя на результаты такого сравнения, некоторые выводы вполне очевидны даже без E6750. Что касается E6850, то его наиболее уместно сравнить с QX6850 (та же архитектура, но 2 ядра vs. 4), что мы и сделали.

Аппаратное и программное обеспечение

Конфигурация тестовых стендов

CPU                                                    Mainboard                                Memory                                          Video
Core 2 eXtreme QX6700                ASUS P5B Deluxe               Corsair CM2X1024-6400C4                GeForce 8800 GTX
Core 2 eXtreme X6800                  ASUS P5B Deluxe               Corsair CM2X1024-6400C4                GeForce 8800 GTX
Core 2 eXtreme QX6850                ASUS P5B Deluxe               Corsair CM2X1024-6400C4                GeForce 8800 GTX
Core 2 Duo E6850                         ASUS P5B Deluxe               Corsair CM2X1024-6400C4                GeForce 8800 GTX
Core 2 Duo E8200                         ASUS P5B Deluxe               Corsair CM2X1024-6400C4                GeForce 8800 GTX

Объём памяти на стендах — 2 GB (2 модуля)

Жёсткий диск — Samsung HD401LJ (SATA)

Кулер Thermaltake TMG i1

БП — Cooler Master RS-A00-EMBA

http://images.netbynet.ru/direct/96023e61ec0c3b93b8e219fbe0a65fcd.jpg

* — если указано «2x...», то имеется в виду «по ... на каждое ядро»
** — у процессоров AMD — частота шины контроллера памяти
*** — у процессоров Intel и AMD указывается по-разному, поэтому сравнивать напрямую некорректно

Программное обеспечение

Windows XP Professional x64 edition SP1
3ds max 9 x64 edition
Maya 8.5 x64 edition
Lightwave 3D 9 x64 edition
MATLAB R2006a (7.2.0.32) x64 edition
Pro/ENGINEER Wildfire 2.0
SolidWorks 2005
Photoshop CS2 (9.0)
Visual Studio 2005 Professional
Apache HTTP Server 2.2.4
CPU RightMark 2005 Lite (1.3) x64 edition
WinRAR 3.62
7-Zip 4.42 x64 edition
FineReader 8.0 Professional
LAME 3.97
Monkey Audio 4.01
OGG Encoder 2.83
Windows Media Encoder 9 x64 edition
Canopus ProCoder 2.01.30
DivX 6.4
Windows Media Video VCM 9
x264 v.604
XviD 1.1.2
F.E.A.R. 1.08
Half-Life 2 1.0
Quake 4 1.3
Call of Duty 2 1.2
Serious Sam 2 2.07
Supreme Commander 1.0.3220

Тестирование

Необходимое предисловие к диаграммам

Форма представления результатов в используемой нами методике тестирования имеет две особенности: во-первых, все типы данных приведены к одному — целочисленным относительным баллам (производительность рассматриваемого процессора относительно Intel Core 2 Duo E4300, если скорость последнего принять за 100 баллов). Во-вторых, подробные результаты приводятся в виде таблицы в формате Microsoft Excel, в статье присутствуют только сводные диаграммы по классам бенчмарков. Тем не менее, иногда мы будем обращать ваше внимание на подробные результаты, если они того заслуживают.

Пакеты трёхмерного моделирования

http://images.netbynet.ru/direct/2cc24473f2077510491077ac09b032e8.jpg

Победа четырёхъядерников в данной подгруппе тестов была предрешена ввиду того, что среди тестов присутствует рендеринг. Более странно смотрится то, что E6850 не удалось обогнать X6800, несмотря на большую частоту ядра и более быструю шину. Результаты E8200 не выходят за рамки ожидаемых: даже в полтора раза больший кэш второго уровня не смог компенсировать отставание по частоте на 333 МГц.

CAD/CAE пакеты

http://images.netbynet.ru/direct/9409a8f7a2b04113dd98e50a15e9c114.jpg

В этой группе тестов количество ядер практически не играет роли, так как ни одно приложение толком многоядерность не поддерживает (вроде бы частичная поддержка есть в MATLAB, но увидеть её на практике нам не удалось — видимо, встроенный бенчмарк использует «не те» функции). Поэтому QX6700 как раз совершенно спокойно можно сравнить с E8200... и мы видим, что, по крайней мере, CAD'ы продемонстрировали достаточно равнодушное отношение к новому ядру. QX6850 оказался примерно на 2% быстрее E6850, но мы склонны считать это погрешностью измерений.

Обработка цифрового фото

http://images.netbynet.ru/direct/ee2464191fd301332711b48b9adfae1d.jpg

Adobe Photoshop снова демонстрирует нам прекрасную поддержку многоядерности (в том числе четырёх-), благодаря чему QX6850 выиграл у E6850 на целых 21%. И впервые мы видим какой-то эффект от нового ядра: E8200 даже обогнал на один балл старичка-«экстремала» X6800, хотя последний работает на существенно большей частоте.

Компиляция

http://images.netbynet.ru/direct/924e1caf22dac449da2665d31b9fc77b.jpg

Равные результаты QX6850 и E6850 говорят нам либо о том, что Visual Studio 2005 не очень хорошо умеет задействовать более двух ядер... либо о том, что следует сменить компилируемый проект. Впрочем, не будем забегать вперёд, это уже задача для следующей версии методики тестирования. А равные результаты пары X6800/E8200 наглядно демонстрируют преимущества нового ядра.

Веб-сервер

http://images.netbynet.ru/direct/883eb17e57c436eabc280faa7a0b39a7.jpg

Четырёхъядерники в данном тесте традиционно «тормозят», поэтому их можно не рассматривать. Быстрая шина E6850 позволила ему неожиданно сильно обогнать X6800, а E8200, несмотря на такую же шину и больший объём кэша, X6800 только догнал.

Синтетика

http://images.netbynet.ru/direct/e1b2ae6abe909723aeafde0c6a786aef.jpg

В статье про новое 45-нанометровое ядро мы уже обращали внимание читателей на то, какое существенное преимущество оно демонстрирует в CPU RightMark. На этой диаграмме вы можете наблюдать это ещё раз: E8200 обогнал E6850 на 15%!

Упаковка данных

http://images.netbynet.ru/direct/55874d1fc32f59ca232d553dba61eaaf.jpg

Четырёхъядерники никак не отметились — мы уже писали ранее, что задействованием двух ядер возможности используемого в данном подтесте ПО, судя по всему, ограничиваются. А E8200 на базе нового ядра выступил отменно: даже чуть-чуть обогнал E6850.

Оптическое распознавание

http://images.netbynet.ru/direct/e1cfc14b816dd48ae51e41db3acf0248.jpg

Никаких преимуществ нового ядра не видно.

Кодирование аудиоданных

http://images.netbynet.ru/direct/f8b4c87f2f2c04dd958a0b8593b6d9ee.jpg

«Старая» подгруппа тестов, практически полностью потерявшая актуальность на данный момент, ввиду высокой предсказуемости результатов. No comments.

Кодирование видеоданных

http://images.netbynet.ru/direct/94d143faeb3b8b438c3daa12e11d8d79.jpg

Всё-таки преимущество нового ядра видно, хоть и не так ярко: если бы его не было вообще, E8200 проиграл бы ещё сильнее.

Игры

http://images.netbynet.ru/direct/ebf51ac6191daf980749d6539a184817.JPG

Совершенно фантастический результат нового ядра даже не нуждается в комментариях.

Общие баллы

http://images.netbynet.ru/direct/9add53d2d15228b19648056e60ec968b.jpg

Обратите внимание на то, насколько велика разница между общим «профессиональным» и общим «домашним» баллом в случае сравнения E6850 и QX6850. В первом случае E6850 проиграл целых 13%, а во втором — всего лишь 3%. Учитывая критерии, по которым те или иные подтесты причислялись к одной из групп, достаточно очевиден ответ на вопрос, место ли четырёхъядернику в домашнем компьютере. Новое ядро в лице E8200 выступило в целом отлично: общий балл такой же, как у X6800, что практически не оставляет сомнений в том, как закончилось бы соревнование с E6700/6750.

Предположительное энергопотребление

http://images.netbynet.ru/direct/9951ad417697e9b7cc4b2f72d9d7421f.jpg

Результаты вполне предсказуемые, лишь немного смущает более высокое энергопотребление E8200 (в сравнении с E6850) в состоянии покоя. Но у нас пока нет статистики по двухъядерникам на 45-нанометровом ядре, поэтому данный артефакт может быть чем угодно, вплоть до особенности конкретного экземпляра процессора.

Заключение

В целом, всё уже сказано в комментариях к финальным диаграммам. Даже если судить по текущему состоянию цен, двухъядерники на 45-нанометровом ядре выглядят гораздо перспективнее 65-нанометровых «старичков». Что, судя по тенденциям, обозначившимся в последние два года, свидетельствует о том, что скоро должна начаться достаточно жёсткая «чистка» в модельном ряду Core 2 Duo.

Модули памяти для тестовых стендов предоставлены
российским представителством Corsair Memory

Станислав Гарматюк (nawhi@ixbt.com)
Опубликовано — 7 марта 2008 г.

0

2

Автор: Александр Будик
Дата: 29.03.2008

Новые архитектуры и технологии Intel, часть I: Dunnington, Nehalem

Что же ждёт нас на весеннем IDF 2008 в Шанхае?

посетители Форума получат информацию о новом процессоре класса SoC (System-on-Chip, "система на чипе"), известном нам под кодовым обозначением Tolapai, микроархитектуре следующего поколения Intel Nehalem, решениях Intel для встраиваемых систем и общих положениях по проектированию платформ Ruggedized Embedded Computing, Digital Security Surveillance и Network Security; про обновления спецификации отраслевого стандарта UEFI и дальнейших направлениях его развития; о технологиях виртуализации и визуализации с высоким разрешением; о твердотельных устройствах хранения данных на базе флэш-памяти.

Dunnington - первые шестиядерные процессоры Intel для многопроцессорных серверов

Эти чипы будут основаны на базе 45-нм версии микроархитектуры Core и, судя по всему, станут последними представителями поколения Penryn.

Чипы Dunnigton являются решениями для многопроцессорных серверов и будут представлены в рамках платформы Caneland под брендом Intel Xeon. Для производства шестиядерных чипов Intel применит 45-нм технологию с использованием металлических затворов и High-K диэлектриков, что позволит разместить на одном кристалле 1,9 млрд транзисторов. Все шесть ядер совместно с массивами ячеек кэш-памяти разместятся на одном кристалле, хотя ранее некоторые обозреватели полагали, что Intel просто упакует три двухъядерных кристалла Wolfdale в один корпус.

В процессорах Dunnington применена концепция многоуровневого разделяемого кэша. На каждую пару ядер приходится по одному массиву ячеек кэш-памяти второго уровня емкостью 3 Мб, соответственно, общий объем кэша L2 достигает 9 Мб. Также на кристалле разместится разделяемый кэш третьего уровня, емкость которого будет составлять до 16 Мб. Отметим, что предшественники Dunnington, четырехъядерные чипы серии Xeon 7300 (Tigerton) для многопроцессорных серверов, имеют до 8 Мб кэша L3.

Из других технических особенностей Dunnington, известных нам сегодня, отметим шину FSB с производительностью 1066 мегатранзакций в секунду, схему 40-разрядной адресации физической памяти; привычную корпусировку mPGA604; TDP 130 Вт; поддержку технологии виртуализации VT FlexMigration с широкими возможностями совместимости и поддержкой миграции на будущие платформы с архитектурой Core или последующими микроархитектурами.

По официальным данным, дата релиза намечена на второе полугодие 2008. Учитывая, что шестиядерные чипы должны стать неким промежуточным решением между современными четыёхъядерными Xeon (Core) и процессорами следующего поколения микроархитектуры Nehalem, которые должны появиться в четвертом квартале текущего года, выход в свет Dunnington можно ожидать уже в третьем или самом начале четвертого квартала.

Микроархитектура Intel Nehalem

Предвосхищая анонсы шанхайского IDF Spring 2008, на днях с докладами о ключевых особенностях Nehalem выступили Патрик Гэлсингер (Pat Gelsinger), старший вице-президент и главный управляющий подразделения Digital Enterprise Group (DEG), вице-президент и директор Digital Enterprise Group Operations Стэфен Смит (Stephen L. Smith) и главный инженер DEG Ронак Сингэл (Ronak Singhal).

Итак, выделим главные особенности и усовершенствования в микроархитектуре Intel Nehalem, после чего приступим к их детальному разбору:

масштабируемость до восьми ядер;
унаследованная от микроархитектуры Core способность обработки четырёх команд за один тактовый цикл;
технология параллельной обработки потоков Simultaneous Multi-Threading (SMT);
интегрированный контроллер памяти (ИКП);
использование общей кэш-памяти третьего уровня с инклюзивным механизмом вытеснения;
новая шина общения с внешними устройствами - QuickPath Interconnect (QPI);
динамическое управление питанием;
новый набор расширений SSE4.2.

На данный момент максимальное количество ядер в процессорах Intel для настольных систем не превышает четырех. Появление ядра Dunnington во второй половине года позволит увеличить это число до шести. С внедрением новой микроархитектуры максимальное количество ядер возрастёт до восьми, хотя первое поколение процессоров Nehalem, возможно, не будет включать восьмиядерные модели. Возможно, Intel придержит выпуск "восьмиядерников" до 2009 года, когда состоится плановая миграция на новый 32-нм техпроцесс, с помощью которого будет проще уместить все восемь ядер на монолитном кристалле.

Интересным нововведением является технология Simultaneous Multi-Threading. Детали реализации SMT и её отличия от Hyper-Threading пока не разглашаются. В рекламных буклетах отмечаются лишь общие положения, связанные с SMT:

каждое ядро будет способно одновременно обрабатывать два потока (таким образом, восьмиядерные процессоры смогут параллельно обрабатывать до 16 потоков);
увеличится энергоэффективность процессоров;
повысится производительность на 20-30% при выполнении задач, оптимизированных под многопоточность (мультимедийные приложения, базы данных, поисковые системы).

структура процессора Nehalem условно разбивается на пять основных строительных блоков: процессорное ядро, интегрированный контроллер памяти, массив ячеек кэш-памяти, шина QuickPath Interconnect (подробнее о ней мы расскажем чуть позже) и видеоядро iGraphics. Объединяя все эти компоненты в разных комбинациях, производитель выведет на рынок целый ряд продуктов для разных сегментов рынка. Интегрированный контроллер памяти будет включать три канала и поддерживать до трёх слотов DIMM на канал. Как и ожидалось, ИКП сможет работать с памятью типа DDR3, включая DDR3-800, DDR3-1066, DDR3-1333, хотя отмечается возможность реализации поддержки и более скоростных модулей памяти, причём предусмотрена поддержка как традиционных небуферизированных модулей UDIMM для установки в настольные ПК и ноутбуки, так и регистровой памяти RDIMM для серверных систем.

В Intel обещают существенное уменьшение задержек и радикальное увеличение пропускной способности памяти. По внутренним тестам компании, выигрыш в ПСП системы на базе Nehalem по сравнению с Harpertown будет более чем четырехкратным.

Перейдём к детальному рассмотрению подсистемы кэширования, принятой в рамках новой микроархитектуры и представляющей собой дальнейшее развитие технологии Intel Smart Cache. Структура кэш-памяти первого уровня осталась без изменений - 32 Кб для хранения команд и 32 Кб - для данных. Подсистема кэш-памяти второго уровня предусматривает выделение отдельного массива ячеек емкостью 256 Кб каждому ядру, при этом отмечается низкая латентность кэш-памяти. Кроме того, предусмотрен также кэш третьего уровня емкостью до 8 Мб, который будет общим для всех ядер процессора.

Пришло время приступить к описанию одного из наиболее важных и горячо обсуждаемых нововведений - замены традиционной шины FSB новым высокоскоростным соединением QuickPath Interconnect, ранее известным также под кодовым обозначением Common System Interface (CSI).

Появление всё более мощных процессоров приводит к тому, что потенциальным "бутылочным горлышком" системы оказывается системная шина, которая играет ключевую роль во взаимодействии CPU и остальных компонентов компьютера. Другими словами, когда процессор выполняет команды быстрее, чем они к нему приходят, он работает не в полную силу, простаивает в ожидании.

В настоящее время в платформах Intel используется внешняя двунаправленная шина, известная нам как FSB (Front-Side Bus). Она представляет собой связующее звено между процессорными ядрами и чипсетом, который включает контроллер памяти и выступает в качестве точки доступа к другим шинам (например, PCI, AGP и т.п.) материнской платы. Основными способами увеличения производительности системной шины FSB является повышение её частоты и объединение сразу нескольких FSB в одной системе. Для уменьшения нагрузки на FSB компания Intel также оснащает свои процессоры более ёмкой кэш-памятью с большей степенью ассоциативности.

Потенциал FSB иссякает, пришло время внедрять совершенно новую системную архитектуру. В рамках QuickPath Architecture предполагается размещать контроллер памяти непосредственно в процессоре, а также использовать принципиально новую системную шину QuickPath Interconnect. Шина QPI будет использоваться также в процессорах Tukwila (Itanium)

Организация QuickPath Architecture позволяет обеспечить высокоскоростной обмен данными между процессором и внешней памятью, между процессором и концентратором ввода/вывода. Ключевой особенностью архитектуры является применение концепции масштабируемой разделяемой памяти (scalable shared memory) вместо традиционного единого пула памяти, к которому процессоры имеют доступ по единственной шине - FSB. В рамках новой архитектуры каждый CPU будет иметь собственную выделенную память, к которой он будет обращаться напрямую, через свой ИКП. В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QuickPath Interconnect (Intel обещает, что такой доступ займет ненамного больше времени, так как QPI обеспечивает очень высокую скорость передачи данных). Как и шина HyperTransport, уже несколько лет применяемая в процессорах компании AMD, QPI будет использовать последовательную связь по схеме "точка-точка" (point-to-point), что обеспечит высокую скорость при малой латентности.

Перечислим ключевые характеристики Intel QuickPath Architecture:

производительность каналов QuickPath Interconnect достигает 6,4 гигатранзакций в секунду, благодаря чему общая пропускная способность может достигать 25,6 Гб/с (именно гигабайт, не гигабит; на презентационном слайде Intel, приведённом ниже, - опечатка);
QPI уменьшает количество служебной информации, необходимой для функционирования многопроцессорных систем, что, соответственно, позволяет повысить скорость передачи полезных данных;
реализация контроля при помощи циклического избыточного кода (CRC) и повторной передачи при обнаружении ошибок на канальном уровне, что позволяет обеспечить целостность данных без ощутимого влияния на производительность;
возможность реализации высокоуровневых функций обеспечения надежности, готовности и удобства обслуживания (RAS, Reliability, Availability and Serviceability) благодаря реконфигурации каналов в случае повреждения отдельных участков, поддержке "горячей замены".

В Intel отмечают, что многие разработчики чипсетов уже работают над решениями для серверов с использованием QPI. Для поддержки процессоров Nehalem компания представит набор системной логики, известный под кодовым обозначением Tylersburg. Он будет использоваться в серверах, рабочих станциях и настольных ПК класса High-End.

Напоследок осталось рассмотреть новый набор расширений SSE4.2. Он включает поддержку всех сорока семи команд SSE4, о которых мы рассказывали в нашем предыдущем материале о 45-нм процессорах Intel, а также семь новых программно-ориентированных ускорителей (ATA, Application Targeted Accelerator) обработки строк и текстовой информации. По утверждению разработчиков, дополнительные ускорители будут полезны, например, в задачах лексического и синтаксического анализа, при работе с регулярными выражениями, поиске вирусов.

0

3

Автор: Александр Будик
Дата: 01.04.2008

Новые архитектуры и технологии Intel, часть II: Tukwila, Larrabee

Tukwila - следующий виток эволюции Itanium

Во второй половине этого года компания Intel планирует выпустить процессоры для серверов и рабочих станций с кодовым обозначением Tukwila, которые станут первыми четырёхъядерными представителями продуктовой линейки Itanium. Кроме того, чипы нового поколения установят своеобразный рекорд, так как станут первыми микропроцессорами в отрасли, объединяющими около двух миллиардов транзисторов.

Для любителей подробностей отметим, что, собственно, на четыре ядра приходится "всего" 450 млн транзисторов, остальные распределяются между системным интерфейсом - около 157 млн; подсистемой ввода/вывода - 39 млн; кэш-памятью - 1,42 млрд транзисторов. Кстати, кэш не случайно включает львиную долю транзисторов, ведь его общая емкость будет достигать 30 Мб. При таком огромном количестве полупроводниковых элементов габариты корпуса "процессоров-миллиардеров" составят 21,5х32,5 мм (почти 700 мм2).

В Intel уверяют, что Tukwila опередит по производительности современные двухъядерные Montvale (серия Itanium 9100) более чем в два раза. Точной информации о тактовых частотах процессоров Tukwila пока нет, но на февральской конференции ISSCC 2008 (International Solid State Circuits Conference) представители Intel говорили о покорении рубежа 2 ГГц, в то время как частоты современных двухъядерных процессоров Itanium не превышают 1,66 ГГц. Что касается уровня TDP, то, по последним данным, для Tukwila его значение составит 130 Вт. Для сравнения, тепловой пакет двухъядерных Itanium (Montvale) составляет 104 Вт.

Следует отметить, что повышения энергоэффективности удалось достичь во многом благодаря переходу на более прецизионный техпроцесс. На данный момент процессоры Itanium выпускаются по 90-нм нормам, в то время как Tukwila смогут использовать все преимущества 65-нм производственной технологии. Также снижению энергопотребления способствовали изменения на схемном уровне, которые позволили снизить рабочие напряжения питания. Приведём ориентировочные показатели потребляемого напряжения и мощности питания для ключевых компонентов процессоров Tukwila:

ядра: 0,9-1,15 В/100 Вт;
системный интерфейс: 0,9-1,15 В/30 Вт;
кэш-память: 1,1 В/20 Вт;
подсистема ввода/вывода: 1,1 В/20 Вт.

Среди ключевых особенностей Tukwila можно отметить новую высокоскоростную системную шину QuickPath Interconnect; два интегрированных контроллера памяти; реализацию одновременной обработки двух потоков (технология Simultaneous Multi-Threading). Наряду с этим ожидается наличие поддержки высокоуровневых функций обеспечения надежности, готовности и удобства обслуживания (RAS, Reliability, Availability and Serviceability), в частности, функции DDDC (Double Device Data Correction), которая позволит памяти продолжать работу даже в случае серьезных аппаратных ошибок на двух последовательных модулях в динамическом ОЗУ, а также сохранение частоты появления программных ошибок (SER, Soft Error Rate) на прежнем уровне, несмотря на трехкратное увеличение количества логических элементов.

К сожалению, никаких данных о конкретных моделях и, тем более, ориентировочных ценах, пока нет.

Larrabee - архитектура для визуальных вычислений

Larrabee, представляет собой следующий виток эволюции визуальных вычислений. Как отмечается, первая демонстрация продукта на базе новой архитектуры состоится ближе к концу текущего года.

Концепция Larrabee включает высокопроизводительный SIMD (Single Instruction Multiple Data) векторный процессор (VPU, Vector Processing Unit), а также новый набор векторных инструкций, в число которых входят команды для работы с целочисленными и вещественными операндами, векторные операции с памятью, условные команды. Кроме того, Larrabee предусматривает использование новой схемы анализа когерентности кэш-памяти - важной функции, играющей одну из ключевых ролей в многоядерных системах.

Отмечается возможность программирования для решения широкого круга вычислительных задач (задач общего назначения), то есть, по сути, Larrabee можно отнести к процессорам класса GPGPU (General Purpose Graphical Processor Unit), хотя сама компания в своих официальных заявлениях этот термин не использует. Отметим, что идея GPGPU уже реализована в продуктах ключевых разработчиков графических ускорителей, например, AMD продвигает на рынок свою технологию Stream Computing, а NVIDIA имеет в своём арсенале аппаратно-программную архитектуру CUDA.

Для производства Larrabee будет использоваться 45-нм техпроцесс. Чипы габаритами 49,5х49,5 мм будут включать от 16 до 24 ядер, способных обрабатывать одновременно четыре потока. Предполагается, что тактовые частоты будут находиться в пределах от 1,7 до 2,5 ГГц (по некоторым данным, до 2 ГГц), при этом уровень TDP составит не менее 150 Вт.

Каждое ядро будет иметь 32 Кб кэша первого уровня с латентностью в один такт, а также кэш L2 емкостью 256 Кб и латентностью 10 тактов. Кроме того, чип будет включать два контроллера памяти и блоки выборки текстур. Правда, на "упрощенном" презентационном слайде, приведённом ниже, все эти компоненты не изображаются. Производительность GPGPU-процессоров в операциях с плавающих запятой будет измеряться терафлопсами.

Впрочем, каким бы мощным и функциональным не было "железо", без эффективного программного обеспечения оно превращается в груду металлолома. Прекрасно понимая это, в Intel стараются уделять должное внимание разработке инструментов для программистов. Помимо традиционных пакетов MPI Library, Thread Checker, Thread Profiler и других, Intel представит для Larrabee дополнительные программные инструменты. Новая архитектура будет поддерживать современные API DirectX и OpenGL.

0

4

Автор: Александр Митрофанов
Дата: 12.11.2007

Процессор Intel QX9650 семейства Penryn

В уходящем 2007 году, компания Intel подготовила пользователям довольно приятный сюрприз: запустила в производство новую серию процессоров выпущенных по 45 нм

техпроцессу. Любая смена техпроцесса является очень удачным моментом для обновления структуры процессорного ядра. Дело в том, что любое ядро (не важно какое - это может

быть видео, процессор, чипсет, звуковой процессор и пр.) не является совершенным, в нем есть ошибки, недоработки, а также нереализованные (по многочисленным

соображениям) возможности. Ошибки (за исключением очень серьезных, которых уже не было года три-четыре) пользователь не видит: они обходятся на уровня чипсета и BIOS

материнской платы. И как только стало известно о переходе Intel на 45нм техпроцесс, все стали ожидать обновление ядра Conroe. И Intel оправдала ожидания - представила

новое семейство процессоров под названием Penryn, которое включает 4-ядерное ядро Yorkfield и 2-ядерное Wolfdale.

Ядро Conroe является на сегодняшний момент наиболее совершенным и "продвинутым", и процессоры на нем легко обходят единственных конкурентов из AMD. Поэтому вполне

понятна позиция Intel, которая не стала изменять принципиальную архитектуру Core, а ограничилась только модификацией.


Итак, что же изменили и добавили инженеры Intel.

Во-первых серьезно ускорено выполнение операций деления (как целых, так и вещественных чисел).

Модифицированный блок деления получил название Fast Radix-16 (у семейства Core аналогичный блок назывался Radix-4). Результат - за один проход новый блок обрабатывает 4 бита вместо двух. Вообще-то, программисты по традиции продолжают избегать операций деления, как относительно медленных, заменяя их умножением. То же самое делают и различные компиляторы. Но в любом случае, любое ускорение операций деления пойдет на пользу общей производительности процессора. К тому же, операции извлечения квадратного корня не так-то просто обойти, а именно тут Penryn работает гораздо быстрее Conroe.

Еще у Penryn серьезно модифицирован блок отвечающий за исполнение потоковых команд. На этот шаг инженеры Intel пошли, поскольку в новых процессорах реализован

дополнительные набор инструкций SSE4.1. Наибольшие изменения коснулись блока перестановок, который осуществляет битовые перестановки в 128-битных регистрах. Теперь

такие операции как упаковка, распаковка, сдвиг упакованных значений, вставка выполняются в соответствующем регистре всего за один такт. В результате блок перестановок

получил название Super Shuffle Engine, а его использование дает практически двукратный рост производительности при выполнении потоковых инструкций. Сам набор потоковых

команд SSE4.1 включает 47 новых инструкций, которые значительно облегчают жизнь программистам при разработке программного обеспечения связанного с обработкой потоковой

информации. Это могут быть задачи видео и аудио кодирования, научные задачи и трехмерная графика.

А сейчас попытаемся разобраться, что все это дает простому пользователю.

Итак, обычный домашний пользователь никакой разницы в скорости между процессорами Core и Penryn

не заметит. Да, Penryn работает чуть быстрее за счет более "зрелой" архитектуры, но в обычном, неоптимизированном программном обеспечении эта разница будет составлять

несколько процентов. Другое дело - оптимизированное ПО. Для начала оптимизация под многоядерность. Если она есть, то прирост производительности 4-ядерного процессора по

сравнению с условным одноядерным (работающем на такой же частоте, и имеющий ту же архитектуру) может колебаться от 200% до 400%! А оптимизация под использование

инструкций SSE4.1 обеспечивает преимущество Penryn над Core до 30% при одной и той же частоте.

Единственный вопрос - где все это оптимизированное ПО? Среднестатистический пользователь с таким, к сожалению, не сталкивается. Да и сами программисты не горят желанием

тратить ресурсы на решение подобных задач.

Однако, на компьютере не только играют - на нем еще иногда и работают. Здесь ситуация с оптимизацией получше. Соответствующие дополнения есть в разнообразных

графических редакторах (различные 3DMax, POV-ray и Photoshop CS), в программах обработки видео (DivX, Microsoft Media Encoder). Например DivX 6.7 уже сейчас

поддерживает SSE4.1. Это значит, что перекодируя утром фильм для последующего просмотра его на мобильном устройстве, обычный студент сэкономит время, и таки успеет на

первую пару. Еще значительный выигрыш будет заметен в программах архивирования (например WinRAR). Но кроме таких программ, большая часть другого ПО использует сжатие

данных - например все последние игры на движках ID Software хранят массу файлов в виде сжатых файлов-контейнеров. Иными словами - загрузка определенных игр и переход

между уровнями будет происходить заметно быстрее.

Стоит подчеркнуть еще один момент. Новые процессоры Penryn лучше всех своих предшественников не только за счет усовершенствований, но и за счет собственно 45 нм

техпроцесса. Напряжение ядра стало меньше, тепловыделение меньше, а потенциал тактовой частоты - выше. Однако, Intel не спешит наращивать частоты: известно только о

запланированном достижении частот 3,0 - 3,33 ГГц. А возможно при переходе на 400МГц шину, мы увидим процессор с частотой 3,6 ГГц. Но это будет к концу 2008 года. Именно

до этого срока запланировано время жизни семейства Penryn, после которого на сцене появится совершенно новая архитектура Nehalem со встроенным контроллером памяти

(топовые процессоры будут иметь 8 ядер и одновременно исполнять 16 потоков!). Тогда же Intel точно перейдет на 32 нм техпроцесс, а AMD, может быть, порадует сообщением

о успешном освоении 65 нм техпроцесса.

Конечно же 45 нм техпроцесс порадует оверклокеров, как только они получат в руки первые такие процессоры. Потенциал ядра выше - значит можно разгонять сильнее;

тепловыделение процессоров меньше - значит можно подать более высокое напряжение (на том же самом кулере), и опять же разогнать еще сильнее. Осмелюсь даже предположить,

что тактовая частота = 4 ГГц уже не будет считаться "достижением", как происходит сейчас с 65 нм процессорами Core.

Однако, преимущества 45 нм техпроцесса не ограничиваются радостью оверклокеров. Он позволяет инженерам Intel уменьшить физические размеры ядра, что означает снижение

его себестоимости (т.е. на одной пластине можно "вырастить" большее количество ядер). Снижение себестоимости никак не касается пользователей - они получают процессоры

по стандартным, фиксированным ценам. Но! Покупая процессор семейства Penryn (Yorkfield или Wolfdale) пользователь получает не 4 мегабайта кеш-памяти второго уровня (как

у Conroe), а 6 мегабайт на каждом из чипов. Т.е. у тестового процессора QX9650, который включает два Wolfdale общий объем кеша L2 = 12 Мб, и именно это значение будет

указано во всех спецификациях и прайс-листах. Кстати, о цене - QX9650 будет продаваться по цене в 1000$.

И что самое интересное, даже с большим объемом кеша, физические размеры Wolfdale заметно меньше чем у Conroe: 107 кв. мм. против 143 кв. мм! Причем у Wolfdale на этой

площади расположено 410 миллионов транзисторов, а у Conroe - "только" 291 миллионов.

Получается, что Yorkfield содержит почти миллиард транзисторов (820 или 2 х 410), или примерно миллион транзисторов на $1 (для QX9650)! Более терпеливые приобретут

транзисторы дешевле: в через 6-8 недель выйдет процессор Q9450 (Yorkfield) с тактовой частотой 2,66 ГГц по цене ~$316.

Больший объем кеша L2 положительно повлияет на скорость работы ПО, производительность которого зависит от этого фактора. Однако кеш L2 у Penryn стал несколько

медленнее, чем у Conroe. Впрочем, инженеры Intel отчасти компенсировали этот недостаток функцией Split Load Cache Enhancement.

Что касается типичного тепловыделения, то для тестового процессора QX9650 оно равно 130 Вт. Больше будет выделять только QX9770, у которого TDP будет равно 136 Вт, что

вполне приемлемо для частоты 3,2 ГГц. Эта модель появится в первом квартале 2008 года по цене ~$1400.

Впрочем, до 2008 года еще полтора месяца, а сейчас первым и пока единственным представителем нового семейства Penryn является процессор Core 2 Extreme QX9650 с тактовой

частотой 3 ГГц, который содержит четыре ядра и работает на частоте FSB = 333 МГц (1333 QPB).

Внешне новинка совершенно обыденная, просто еще один LGA775-процессор. Причем даже из маркировки нет возможности определить начинку под теплораспределителем (собственно

как и у всех других инженерных семплов Intel):

http://images.netbynet.ru/direct/58f5a2b4b8472f154889d13108b0cd44.jpg

Если крышку снять, то мы обнаружим два двухъядерных чипа Wolfdale, на каждом из которых установлено по 6 Мб кеш-памяти второго уровня (общий объем кеша L2 = 12 Мб).

На обратной стороне процессора мы можем обнаружить несколько отличную конфигурация конденсаторов.

http://images.netbynet.ru/direct/17814f55dc46fbe6bb9d883c11e7a222.jpg

Утилита CPU-Z предоставляет следующую информацию:

http://images.netbynet.ru/direct/4311e6e25a5ec2fd6bcf78bb085fd607.gif

Теперь, на основании предварительной информации, составим таблицу с характеристиками процессоров семейства Penryn.

http://images.netbynet.ru/direct/505cfc999a1e93e0e07bc95fc81f0cff.jpg


Исходя из таблицы, мы можем сделать несколько умозаключений.

Во-первых, Intel оставила в наименовании процессоров раскрученную марку Core 2 (Duo/Quad/Extreme), что, в

принципе правильно, поскольку семейство Penryn является производным от семейства Core.

Во-вторых, Intel значительно сократила шаг частоты между различными моделями, с

помощью дробных множителей. Трудно припомнить, когда последний раз Intel использовала такие множители.

В третьих, почти все процессоры семейства Penryn имеют частоту

FSB = 333 МГц (т.е. 1333 QPB), и соответственно потребуют современную материнскую плату. И только модель Core 2 Extreme QX9770 будет работать на FSB = 400 МГц (1600

QPB), что потребует материнскую плату на X38 или очень качественную плату на P35 (хотя Intel будет утверждать, что единственным возможным вариантом является плата на

X48, который выйдет одновременно с QX9770).


Отдельно отметим модель E8190, которая по всем характеристикам соответствует E8200, но не поддерживает технологии виртуализации. Впрочем, пользователю сэкономить не

удастся: рекомендованные цены для E8190 и E8200 одинаковы, и равны ~$163.

Кстати, похожая ситуация наблюдается и с процессором E6540, который соответствует E6550, но не

поддерживает технологию Intel TXT (Intel Trusted Execution Technology).


Источник : 3dnews.ru

0

5

Intel запустит Nehalem-процессоры в конце года

Intel планирует запустить три модели четырехъядерных Nehalem-процессоров (Bloomfield) в конце этого года к новому разъему LGA1366. Пока процессорам не дали официальные наименования, но известны их кодовые имена: процессоры XE, P1 и MS3 с тактовыми частотами 3,2 ГГц, 2,93 ГГц и 2,66 ГГц соответственно. Каждый из них потребляет 130 Вт, имеет 8 Мб кэша третьего уровня и будут поддерживать одновременную многопоточность (simultaneous multi-threading, SMT).

Для поддержки этих процессоров также будет запущена комбинация чипсетов X58 и ICH10. Новая платформа, как ожидают, увеличит производительность на 15-30% в сравнении с текущим поколением. Набор микросхем X58 получит архитектуру QuickPath Interconnect (QPI), приходящую на замену шине Front side bus (FSB). Новая платформа также будет иметь 4 слота PCI Express 8x и поддержку технологии AMD Quad CrossFireX.

Также Intel после обновления своей линейки начнет сокращать производство Core 2 Extreme QX6850 и 6800 после июля этого года. А модели высокопроизводительных четырехядерных процессоров Q9550 и Q9650 эта участь ожидает в первом квартале 2009 года. При этом четырехядерные Yorkfield-процессоры станут главной ударной силой в потребительском сегменте до конца 2009 года.

Как сообщалось ранее, Intel планировала начать массовое производство двухъядерных процессоров Atom 330 уже в июле, однако стало известно, что из-за дефицита на одноядерные версии запуск откладывается до сентября, точные планы будут объявлены в августе.

Андрей Горьев

Источник: 3Dnews

0

6

Всё, что вы хотели знать о технологии Turbo Mode в процессорах Nehalem

Журналисты Maximum PC приоткрыли завесу тайны над технологией Turbo Mode, которая является одним из новшеств, заложенных в архитектуру процессоров Intel под кодовым названием Nehalem.

http://www.3dnews.ru/_imgdata/img/2008/08/22/92914.jpg

Принцип работы Turbo Mode заключается в автоматическом разгоне использующегося в данный момент ядра (или ядер) в случае обнаружения уменьшения нагрузки на другие ядра. Несмотря на то, что корпорация Intel продолжает наращивать количество ядер в своих продуктах, она прекрасно понимает, что приложения и игры, не оптимизированные под многоядерные процессоры, не получат значительного прироста в скорости работы на этих чипах. В таком случае почему бы временно не отключить простаивающие ядра, в то же время немного разогнав то, которое используется в данный момент?

Дабы реализовать эту возможность, в новые процессоры Core i7 встроен специальный «модуль для энергетического контроля» (PCU – Power Control Unit), в задачи которого входит непрерывное наблюдение за температурой и энергопотреблением каждого из ядер чипа. Кроме того, появились новые режимы энергосбережения, позволяющие полностью отключить питание для неактивного ядра. Чтобы объяснить работу Turbo Mode более простым языком, рассмотрим следующий пример: если вы играете в не оптимизированную для многоядерных процессоров игру, чип самостоятельно разгонит использующееся ядро со штатных 3,2 ГГц до, скажем, 3,4 ГГц. Однако даже при работе всех ядер PCU будет заботиться о том, чтобы их температура не поднималась выше критического значения.

http://www.3dnews.ru/_imgdata/img/2008/08/22/92913.jpg

Как это будет реализовано на практике? Согласно попавшему в распоряжение сотрудников Maximum PC снимку ранней версии BIOS для архитектуры Nehalem, пользователь сможет самостоятельно устанавливать индивидуальные ограничения для работы Turbo Mode в зависимости от количества ядер, содержащихся в чипе. В результате для поддерживающей только одно ядро игры можно увеличить множитель со штатных 22х до, например, 30х, и получить из своего 2,93 ГГц процессора 4-гигагерцевый «камушек». Если в системе установлен хороший кулер, можно установить множитель 25х для двух ядер, тем самым разогнав их до 3,5 ГГц. Тот же принцип применим и для четырёх ядер.

Напоследок стоит отметить одну вещь, на которой Intel акцентирует особое внимание – TDP кулера. Компания стимулирует поставщиков тестировать свою продукцию таким образом, чтобы она справлялась с процессорами, имеющими энергопотребление в 130 Вт, а лучше 150 Вт. Если эти устройства прошли испытание, значит проблем с перегревом чипов при использовании Turbo Mode быть не должно.

Источник: 3Dnews

0

7

Nehalem Core i7 3,2 ГГц и шокирующий результат в CineBench R10

>>>

0

8

Core i7 920: 4,54 ГГц "на воздухе"!

Для тех, кто хочет собрать компьютер на базе новейшей High-End платформы Intel, но переплачивать не желает, вероятно, оптимальным выбором будет процессор Core i7 920 – самый младший и доступный из линейки чипов с микроархитектурой Nehalem. Его цена, напомним, может составить около $300, хотя первое время она будет, скорее всего, завышена.

Кроме того, получив в руки Core i7 920, любители разгона могут существенно увеличить производительность своей системы, о чём свидетельствуют последние обзоры, появившиеся в Сети. На днях энтузиаст, известный под ником jAkUp, сумел повысить тактовую частоту этого процессора до 4,54 ГГц, не прибегая к различным дорогостоящим водяным или фреонным системам и используя только воздушное охлаждение. Достижение было установлено вместе с материнской платой EVGA на базе чипсета Intel X58 Express. Детальные технические сведения – на скриншотах ниже.

http://www.3dnews.ru/_imgdata/img/2008/11/10/102023.gif

http://www.3dnews.ru/_imgdata/img/2008/11/10/102022.gif

Смущает множитель x21, ведь у этой модели производителем он установлен в значение x20. Таким образом, либо перед нами «поддельный» скриншот, либо народным умельцам удалось неведомым способом изменить множитель, что менее вероятно.

3dnews.ru

0

9

Intel готовит 13 чипов Nehalem с ценой от $188

Сегодня стало известно о планах компании Intel представить в первом квартале 2009 года две новые серии серверных процессоров Xeon 5500 (Nehalem-EP) и Xeon 3500 (Nehalem-WS), которые построены на основе микроархитектуры Nehalem. Всего будет анонсировано тринадцать моделей, среди которых как 2-, так и 4-ядерные чипы с ценой от $188 до $1600.

В линейку Xeon 5500 войдут четырёхъядерные W5580 (3,2 ГГц), X5570 (2,93 ГГц), X5560 (2,8 ГГц), X5550 (2,66 ГГц), E5540 (2,53 ГГц), E5530 (2,4 ГГц), E5520 (2,26 ГГц), E5506 (2,13 ГГц), E5504 (2 ГГц) стоимостью $1600, $1386, $1172, $958, $744, $530, $373, $266 и $224 соответственно в партиях от 1000 шт. Также в рамках этой серии Intel представит самую доступную модель – двухъядерный процессор Xeon E5502 с ценой всего $188.

Серия Xeon 3500 будет включать три четырёхъядерные модели: W3570, W3540 и W3520 стоимостью $999, $562 и $284 соответственно. Пока данные о характеристиках недоступны.

Также источник сообщает, что в январе следующего года Intel планирует запустить программу по снятию с производства семи моделей процессоров для ноутбуков. Среди них отмечаются чипы Core 2 Extreme X7900, Core 2 Extreme X7800, Core 2 Duo T7800 и Core 2 Duo L7700.

0

10

Трио новейших процессоров Intel уже продаётся в Японии


Благодаря стараниям сотрудников сетевого ресурса ASCII.jp стало известно о том, что на прилавках японских специализированных магазинов уже появились три новейших процессора Intel, о выпуске которых накануне мы сообщали в нашей новостной ленте.

http://www.3dnews.ru/_imgdata/img/2008/12/02/105048.jpg

http://www.3dnews.ru/_imgdata/img/2008/12/02/105049.jpg

По данным источника, четырёхъядерный чип Intel Core 2 Quad Q8300 с тактовой частотой 2,5 ГГц, частотой системной шины 1333 МГц и 4 Мб кэш-памяти L2 доступен по цене $256.

http://www.3dnews.ru/_imgdata/img/2008/12/02/105050.jpg

http://www.3dnews.ru/_imgdata/img/2008/12/02/105051.jpg

В свою очередь двухъядерная модель Intel Pentium Dual-Core E5300 с тактовой частотой 2,6 ГГц, частотой системной шины 800 МГц и 2 Мб кэш-памяти L2 предлагается за $104.

http://www.3dnews.ru/_imgdata/img/2008/12/02/105052.jpg

http://www.3dnews.ru/_imgdata/img/2008/12/02/105053.jpg

Что же касается второго двухъядерного дебютанта, коим стал процессор Intel Celeron Dual-Core E1500 с тактовой частотой 2,2 ГГц, частотой системной шины 800 МГц и 512 Кб кэш-памяти L2, то его приобретение обойдётся всего в $69.

0

11

Core 2 Duo E7500 и E8600: два самых быстрых процессора в своем классе


Платформа LGA 775, которой суждено присутствовать на рынке как минимум до 2011 года, будет снабжаться новыми моделями процессоров всех ценовых диапазонов. Доминировать в следующем году решения на базе Core i7 не станут в виду высокой стоимости новой платформы. И долгожителю незачем волноваться за свою популярность у покупателей.

Обратив внимание читателя на то, что 18 января будут представлены новые модели процессоров, хочется остановиться на двух решениях. Уже присутствующая на рынке модель Core 2 Duo E8600 и представленная в начале следующего года Core 2 Duo E7500 будут флагманами в своих сегментах. Если сейчас за $133 покупатель получает процессор Core 2 Duo E7400, работающий на частоте 2,8 ГГц, то буквально через полтора месяца, за те же деньги ему будет доступна более высокая производительность. Стоит отметить, что цена на Core 2 Duo E7400 будет снижена до $113.

Итак, два процессора Core 2 Duo E7500 (2,93 ГГц/3 Мб L2/1066 МГц FSB) и Core 2 Duo E8600 (3,33 ГГц/6 Мб L2/1333 МГц FSB) будут отличаться по стоимости в два раза. В плане производительности такой двукратной разницы, конечно, увидеть не получится. Но по-своему они хороши. Модель Core 2 Duo E7500 получит высокий множитель Х11, который позволит при разгоне получить приличный результат даже на материнских платах, обладающих слабым для этого функционалом. Кроме того, что Core 2 Duo E8600 остается самым быстрым двухъядерным процессором для платформы LGA 775, он еще является и любимцем энтузиастов. Для таких дисциплин как 3DMark’01’03’05 пока нет лучшей процессорной поддержки, чем ту которую обеспечивает этот процессор.

Хотя под елочку Core 2 Duo E7500 не успевает, но отпраздновав все праздники, можно будет устроить себе новый – всего за $133.

0