Apple A9X под микроскопом: два ядра ARMv8, огромный GPU и 128-битный контроллер памяти
Высокоинтегрированная система на кристалле (system-on-chip, SoC) Apple A9X для планшета iPad Pro, по данным разработчика, может предложить производительность, сравнимую с тем, что предлагают процессоры Intel. Apple не раскрывает большого количества подробностей о своей самой мощной SoC, однако снимки ядра A9X, сделанные компанией Chipworks при помощи растрового электронного микроскопа (РЭМ, англ. scanning electron microscope, SEM), приоткрывают некоторые подробности об устройстве.
Согласно измерениям Chipworks, микросхема Apple A9X огромна по меркам процессоров для мобильных устройств. Площадь A9X cоставляет 147 мм², она на 40 % больше, чем площадь Apple A9, выпускаемой по технологическому процессу CLN16FF компанией Taiwan Semiconductor Manufacturing Co. Для сравнения: четырёхъядерный Intel Skylake с графическим процессором класса GT2 имеет площадь ядра в 122 мм², а двухъядерный Intel Haswell с графическим ядром GT3 имеет размер в 177 мм². Типично системы на кристалле для мобильных устройств имеют площадь существенно меньше 100 мм².
Как видно, Apple не стала экономить на микросхеме для своего самого мощного планшета. Однако, в отличие от некоторых современных мобильных SoC, в Apple A9X нет десятка ядер общего назначения или огромных кешей, призванных увеличить производительность в однопоточных приложениях. Вместо этого, судя по всему, Apple планирует положиться на гетерогенные вычисления.
Apple A9X экипирован двумя ARMv8-A-совместимыми ядрами общего назначения Twister, в разработке которых принимал участие легендарный Джим Келлер (Jim Keller). Микропроцессорные ядра (отмечены зелёным на схеме) имеют общий кеш второго уровня объёмом 3 Мбайт и могут работать на тактовой частоте до 2,26 ГГц.
Принимая во внимание, что все 64-разрядные микроархитектуры Apple типично умели декодировать и одновременно исполнять больше ARMv8-инструкций, чем ядра, разработанные ARM, наличие всего двух ядер общего назначения не должно казаться недостатком. К сожалению, достоверных данных об архитектуре Twister нет, и сложно сказать, как производительность пары новых ядер Apple соотносится с конкурирующими изделиями. Тем не менее, высокая тактовая частота и, предположительно, очень эффективная архитектура позволят микросхеме демонстрировать отличный уровень производительности в большинстве приложений.
Вместо того, чтобы интегрировать большое количество ядер общего назначения, Apple встроила в A9X очень мощный графический процессор. GPU базируется на архитектуре Imagination Technologies PowerVR Series7XT и имеет двенадцать кластеров (отмечены синим на схеме), организованные как шесть блоков с некоторой общей логикой. Данная архитектура не только очень эффективна для обработки графики, но и поддерживает возможности таких интерфейсов программирования приложений, как OpenGL 4.3, OpenCL 1.2 и даже DirectX 11.2 (неактуально для Apple и скорее всего не реализовано на аппаратном уровне).
Примечательно, что официально Imagination предлагает решения PowerVR Series7XT с восемью или шестнадцатью кластерами, однако Apple приняла решение использовать конфигурацию из двенадцати кластеров (Imagination называет кластерами блоки unified shading cluster, USC, c 64–128 потоковыми процессорами в каждом). Иными словами, разработчики Apple самостоятельно построили графический процессор на базе архитектуры PowerVR Series7XT, что случалось и раньше, позволяя продуктам Apple иметь лучшую производительность по сравнению с конкурентами в приложениях, требующих вычислительной мощность GPU.
Судя по всему, инженеры Apple максимизировали количество потоковых графических процессоров у GPU чипа Apple A9X ради того, чтобы увеличить вычислительные способности системы на кристалле. По-видимому, Apple планирует использовать технологии GPU-ускорения для приложений, которые требуют серьёзной математической мощности. Принимая во внимание очень высокую эффективность параллельных расчётов на графических процессорах, подобный подход имеет смысл. При должной оптимизации программного обеспечения дополнительные GPU-кластеры внутри SoC обеспечат бóльшую производительность, чем дополнительное ядро общего назначения.
Процессор Apple A9X — первая микросхема компании с восьмиканальным контроллером памяти LPDDR4 (восемь характерных 16-битных интерфейсов заметны внизу и по бокам SoC). Благодаря 128-разрядному доступу к памяти и её тактовой частоте в 3200 МГц, пропускная способность подсистемы памяти A9X составляет 51,2 Гбайт/с, что вдвое больше, чем у других микросхем Apple. Учитывая мощный GPU и высокое разрешение у экрана Apple iPad Pro (2732 × 2048 точек), высокая пропускная способность памяти крайне важна для описываемой системы на кристалле.
Примечательно, что в отличие от A9 и предшественников (A7, A8, A8X), A9X не имеет кеша третьего уровня для ядер общего назначения и GPU. Решение отказаться от кеша можно объяснить возросшей пропускной способностью подсистемы памяти, а также тем фактом, что Apple хотела бы использовать в первую очередь GPU-ускорение для требовательных приложений. Учитывая скромные размеры кеша третьего уровня, едва ли Apple смогла сэкономить существенные деньги на производстве микросхемы, отказавшись от него в A9X. Кроме того, большие кеши зачастую дают возможность экономить электроэнергию, минимизировав использование оперативной памяти. Таким образом, отказ от L3 — весьма спорное решение проектировщиков SoC.
Помимо мощных CPU, GPU и полностью перепроектированной подсистемы памяти, процессоры Apple A9X включает в себя множество специализированных блоков, производительность которых серьёзно влияет на общую работу устройства. Во-первых, Apple A9X имеет полностью новый контроллер NAND флеш-памяти, что увеличит производительность встроенного накопителя данных. Во-вторых, SoC имеет полностью переработанный контроллер дисплея, позволяя последнему работать с переменной частотой обновления. В-третьих, новый чип имеет новые контроллеры сенсоров и целый набор специфических ускорителей. К сожалению, определить всё вышеперечисленное на фото подобного качества не представляется возможным. Тем не менее, подобные «мелочи» занимают существенную — не менее четверти — площадь ядра A9X.
Судя по архитектурным решениям в A9X, вероятно, Apple планирует полагаться на гетерогенные вычисления не только для профессионального ПО, которое будет запускаться на iPad Pro, но и для типичных приложений. По-видимому, в будущем мы увидим дальнейшее увеличение количества GPU-кластеров во всех SoC компании при неизменном количестве ядер общего назначения в ближайшие годы. Во всяком случае, до перехода на 10-нм технологический процесс в конце 2017 года микросхемы Apple продолжат включать в себя два ядра, но мощные современные GPU.
Что касается 128-битного доступа к памяти, то он, вероятно, останется эксклюзивной возможностью A9X или A10X. Интерфейсы памяти требуют места на микросхемах и в случае с чипами для смартфонов «широкий» доступ к LPDDR4 невозможно обеспечить физически. Как следствие, можно ожидать, что будущие SoC компании продолжат использовать кеш третьего уровня для максимизации пропускной способности памяти, если только Apple не решит применять технологии вроде Wide I/O.
Согласно измерениям Chipworks, микросхема Apple A9X огромна по меркам процессоров для мобильных устройств. Площадь A9X cоставляет 147 мм², она на 40 % больше, чем площадь Apple A9, выпускаемой по технологическому процессу CLN16FF компанией Taiwan Semiconductor Manufacturing Co. Для сравнения: четырёхъядерный Intel Skylake с графическим процессором класса GT2 имеет площадь ядра в 122 мм², а двухъядерный Intel Haswell с графическим ядром GT3 имеет размер в 177 мм². Типично системы на кристалле для мобильных устройств имеют площадь существенно меньше 100 мм².
Как видно, Apple не стала экономить на микросхеме для своего самого мощного планшета. Однако, в отличие от некоторых современных мобильных SoC, в Apple A9X нет десятка ядер общего назначения или огромных кешей, призванных увеличить производительность в однопоточных приложениях. Вместо этого, судя по всему, Apple планирует положиться на гетерогенные вычисления.
Apple A9X экипирован двумя ARMv8-A-совместимыми ядрами общего назначения Twister, в разработке которых принимал участие легендарный Джим Келлер (Jim Keller). Микропроцессорные ядра (отмечены зелёным на схеме) имеют общий кеш второго уровня объёмом 3 Мбайт и могут работать на тактовой частоте до 2,26 ГГц.
Принимая во внимание, что все 64-разрядные микроархитектуры Apple типично умели декодировать и одновременно исполнять больше ARMv8-инструкций, чем ядра, разработанные ARM, наличие всего двух ядер общего назначения не должно казаться недостатком. К сожалению, достоверных данных об архитектуре Twister нет, и сложно сказать, как производительность пары новых ядер Apple соотносится с конкурирующими изделиями. Тем не менее, высокая тактовая частота и, предположительно, очень эффективная архитектура позволят микросхеме демонстрировать отличный уровень производительности в большинстве приложений.
Вместо того, чтобы интегрировать большое количество ядер общего назначения, Apple встроила в A9X очень мощный графический процессор. GPU базируется на архитектуре Imagination Technologies PowerVR Series7XT и имеет двенадцать кластеров (отмечены синим на схеме), организованные как шесть блоков с некоторой общей логикой. Данная архитектура не только очень эффективна для обработки графики, но и поддерживает возможности таких интерфейсов программирования приложений, как OpenGL 4.3, OpenCL 1.2 и даже DirectX 11.2 (неактуально для Apple и скорее всего не реализовано на аппаратном уровне).
Примечательно, что официально Imagination предлагает решения PowerVR Series7XT с восемью или шестнадцатью кластерами, однако Apple приняла решение использовать конфигурацию из двенадцати кластеров (Imagination называет кластерами блоки unified shading cluster, USC, c 64–128 потоковыми процессорами в каждом). Иными словами, разработчики Apple самостоятельно построили графический процессор на базе архитектуры PowerVR Series7XT, что случалось и раньше, позволяя продуктам Apple иметь лучшую производительность по сравнению с конкурентами в приложениях, требующих вычислительной мощность GPU.
Судя по всему, инженеры Apple максимизировали количество потоковых графических процессоров у GPU чипа Apple A9X ради того, чтобы увеличить вычислительные способности системы на кристалле. По-видимому, Apple планирует использовать технологии GPU-ускорения для приложений, которые требуют серьёзной математической мощности. Принимая во внимание очень высокую эффективность параллельных расчётов на графических процессорах, подобный подход имеет смысл. При должной оптимизации программного обеспечения дополнительные GPU-кластеры внутри SoC обеспечат бóльшую производительность, чем дополнительное ядро общего назначения.
Процессор Apple A9X — первая микросхема компании с восьмиканальным контроллером памяти LPDDR4 (восемь характерных 16-битных интерфейсов заметны внизу и по бокам SoC). Благодаря 128-разрядному доступу к памяти и её тактовой частоте в 3200 МГц, пропускная способность подсистемы памяти A9X составляет 51,2 Гбайт/с, что вдвое больше, чем у других микросхем Apple. Учитывая мощный GPU и высокое разрешение у экрана Apple iPad Pro (2732 × 2048 точек), высокая пропускная способность памяти крайне важна для описываемой системы на кристалле.
Примечательно, что в отличие от A9 и предшественников (A7, A8, A8X), A9X не имеет кеша третьего уровня для ядер общего назначения и GPU. Решение отказаться от кеша можно объяснить возросшей пропускной способностью подсистемы памяти, а также тем фактом, что Apple хотела бы использовать в первую очередь GPU-ускорение для требовательных приложений. Учитывая скромные размеры кеша третьего уровня, едва ли Apple смогла сэкономить существенные деньги на производстве микросхемы, отказавшись от него в A9X. Кроме того, большие кеши зачастую дают возможность экономить электроэнергию, минимизировав использование оперативной памяти. Таким образом, отказ от L3 — весьма спорное решение проектировщиков SoC.
Помимо мощных CPU, GPU и полностью перепроектированной подсистемы памяти, процессоры Apple A9X включает в себя множество специализированных блоков, производительность которых серьёзно влияет на общую работу устройства. Во-первых, Apple A9X имеет полностью новый контроллер NAND флеш-памяти, что увеличит производительность встроенного накопителя данных. Во-вторых, SoC имеет полностью переработанный контроллер дисплея, позволяя последнему работать с переменной частотой обновления. В-третьих, новый чип имеет новые контроллеры сенсоров и целый набор специфических ускорителей. К сожалению, определить всё вышеперечисленное на фото подобного качества не представляется возможным. Тем не менее, подобные «мелочи» занимают существенную — не менее четверти — площадь ядра A9X.
Судя по архитектурным решениям в A9X, вероятно, Apple планирует полагаться на гетерогенные вычисления не только для профессионального ПО, которое будет запускаться на iPad Pro, но и для типичных приложений. По-видимому, в будущем мы увидим дальнейшее увеличение количества GPU-кластеров во всех SoC компании при неизменном количестве ядер общего назначения в ближайшие годы. Во всяком случае, до перехода на 10-нм технологический процесс в конце 2017 года микросхемы Apple продолжат включать в себя два ядра, но мощные современные GPU.
Что касается 128-битного доступа к памяти, то он, вероятно, останется эксклюзивной возможностью A9X или A10X. Интерфейсы памяти требуют места на микросхемах и в случае с чипами для смартфонов «широкий» доступ к LPDDR4 невозможно обеспечить физически. Как следствие, можно ожидать, что будущие SoC компании продолжат использовать кеш третьего уровня для максимизации пропускной способности памяти, если только Apple не решит применять технологии вроде Wide I/O.
Понравиласть статья? Жми лайк или расскажи своим друзьям!
Комментарии
Добавить комментарий
Похожие новости:
21.04.2016
Обновленный Macbook получил процессор Intel Skylake и более ёмкую батарею. Также впервые появилась возможность купить ноутбук в розовом цвете. Новая версия 12-дюймового Macbook получила процессоры шестого поколения Intel Core M (Skylake) с частотой
18.02.2015
На фоне слухов о грядущем дебюте 12-дюймового планшета iPad Plus в Сети вновь появились сообщения о намерении Apple свернуть производство модели iPad mini. По данным источников ресурса Digitimes, это может произойти в 2015 году. Как утверждается,
29.10.2014
На прошлой неделе Apple представила планшет нового поколения iPad Air 2, основой которого служит процессор А8X. Между тем, как сообщают сетевые источники, одними лишь планшетами сфера применения этих чипов не ограничится. A8X — это улучшенная
26.09.2014
Хотя тайваньская компания Taiwan Semiconductor Manufacturing Co. получила львиную долю заказов на поставку чипов Apple A8 для iPhone 6 и iPhone 6 Plus, у давнего партнёра Apple компании Samsung, как оказалось, тоже размещён заказ на производство