В новостях нашего сайта уже проходила информация о выходе новой модели системы-на-чипе NVIDIA — процессора Tegra 4i, ранее известного как Project Grey. И он, в свою очередь, во многом повторяет своего старшего брата Tegra 4, после анонса которого мы выпустили соответствующий предварительный обзор. В том материале было рассказано многое, но самых главных деталей тогда раскрыто не было, да и анонс Tegra 4i с интегрированным LTE-модемом тогда еще не состоялся. Так что пока мы готовим к выходу полноценный обзор семейства Tegra 4, хотим поделиться с нашими читателями некоторыми впечатлениями об этих решениях калифорнийской компании.
Общеизвестно, что у любого продукта на рынке есть свои достоинства и недостатки. Даже у лучших мобильных решений всегда можно найти что-либо, что у него сделано не так хорошо, как у конкурентов. В случае с NVIDIA Tegra 3 некоторые упирали на отсутствие в этой однокристальной системе интегрированного модема (не говоря уже о поддержке набирающего популярность LTE), на недостаточную производительность устаревшего видеоядра, на меньшую энергоэффективность. Некоторые из этих недостатков действительно стали очевидны в последнее время, когда решение Tegra 3 уже устарело и конкуренты NVIDIA уже выпустили новые чипы, по некоторым параметрам превосходящие эту SoC.
Но NVIDIA не сидела на месте, а работала над Tegra 4 и Tegra 4i. И по анонсированной информации складывается такое впечатление, что самые главные недостатки она все-таки поборола. Впрочем, начнем мы с производительности CPU-части, которая никогда не была слабой стороной чипов NVIDIA. В новом старшем решении, как известно, применяются четыре (точнее пять — 4+1) ядра Cortex-A15. Производительность своего решения компания предлагает оценить по SPECint2000, а не некоторым другим распространенным CPU-тестам, вроде DMIPS и Coremark, которые основаны на старых алгоритмах, используют лишь малую часть возможностей новых чипов, помещаются в L1 кэш целиком и не показывают производительность, отражающую современные нагрузки.
Тесты SPECint2000, показанные выше на диаграмме компании, используют алгоритмы, схожие с теми, что применяются в приложениях навигации, распознавания трехмерных объектов, в текстовом поиске, обработке текстовых данных, Java-приложениях, игровой логике и сжатии данных. Соответственно, можно оценить производительность NVIDIA Tegra 4 по сравнению с системой Qualcomm S4 Pro APQ8064, имеющей четыре ядра Krait, работающие на частоте 1,7 ГГц.
В этом случае разница получается огромной, и в пользу Cortex-A15, который применяется, к слову, не только NVIDIA. Впрочем, тут есть два «но»: во-первых, решения на базе этой модели Snapdragon давно продаются, а смартфоны на Tegra 4 еще непонятно когда появятся в магазинах, а во-вторых, сравнение проведено одной из заинтересованных сторон. Конечно же, в своих обзорах мы по возможности тщательно все перепроверим.
А что же с Tegra 4i? Как известно из нашей новости, эта система-на-чипе использует значительно переработанные ядра Cortex-A9 R4, которые отличаются высокой эффективностью в терминах производительности на миллиметр площади чипа. Поэтому вполне логично, что Tegra 4i даже обгоняет своего старшего брата по этому параметру (понятно, что в абсолютных числах тягаться с A15 у A9 не получится):
Если Tegra 4 по этому параметру лишь в полтора раза лучше последней версии Qualcomm Krait (по данным NVIDIA), то Cortex-A9 R4 оказывается значительно эффективнее их обоих. Получается, что у NVIDIA есть как наиболее высокопроизводительный чип (Tegra 4), так и самый эффективный (Tegra 4i).
Но мы пока что касались лишь CPU-части, с которой у новых решений все более-менее в порядке (хотя вопрос, что лучше: два Krait или четыре A9 R4 — остается открытым как минимум до независимых тестов). А в том, что касается GPU, у нас есть две новости — хорошая и не очень хорошая. Начнем с последней: графический чип Tegra 4 по возможностям не слишком далеко ушел от Tegra 3 — основа у их GPU одна и та же.
Многие считают явным недостатком предыдущего чипа Tegra 3 отсутствие поддержки OpenGL ES 3.0. Но среди возможностей этой версии API новые мобильные GPU NVIDIA поддерживают почти все важные: расширение FBO_render_mipmap, Uniform Buffer Objects, Separate Shader Objects, Framebuffer Blit, расширение ARB_copy_buffer, Explicit Attribute Locations, Surface-less context creation, Texture Storage, Pixel Buffer Objects, 24-bit Depth, FP16 Texture Filtering, MSAA, Occlusion Queries, Non-square Matrices, Multiple Render Targets, R8, RG8, RGB8, RGBA8, RGB565, SRGB8_ALPHA8, RGBA4, RGB5_A1 и другие форматы.
Вообще, по словам представителей NVIDIA, из всех особенностей OpenGL ES 3.0 новыми видеоядрами серии Tegra 4 не поддерживаются только точность вычислений FP32 в пиксельных шейдерах и формат сжатия ETC2. Тем не менее, это не позволяет поставить в спецификациях соответствующую галочку. Зато NVIDIA уверяет, что они первыми поддерживают все возможности, необходимые для реализации полноценного HDR-рендеринга в мобильных решениях: фильтрация FP16 и блендинг, а также MRT и sRGB — о некоторых из этих возможностей вы можете помнить по десктопным решениям — они начали применяться со времен Far Cry.
А для продвинутого рендеринга теней новыми чипами поддерживаются depth textures и фильтрация текстур PCF (percentage-closer filtering), что позволяет создавать тени с мягкими краями — это также появилось в играх на ПК несколько лет назад, а теперь постепенно приходит и в мобильные 3D-игры.
Но не претерпевшие серьезных архитектурных изменений графические возможности не означают, что в линейке Tegra 4 не изменилось ничего: производительность и эффективность у нее выросла, причем очень сильно. Если Tegra 3 имеет один блок вершинных шейдеров (содержащий четыре ALU) и два пиксельных конвейера (8 ALU), то Tegra 4i содержит три блока вершинных шейдеров (12 ALU) и два пиксельных конвейера (48 ALU), в то время как топовый чип Tegra 4 отличается шестью блоками вершинных шейдеров (24 ALU) и четырьмя пиксельными конвейерами (48 ALU).
Tegra 4 GPU
Tegra 4i GPU
Надо сказать, что NVIDIA сделала очень интересный шаг, сблизив возможности столь разных решений (как минимум вычислительно). По площади видеоядра между Tegra 4 и Tegra 4i разница небольшая — если старший GPU занимает более 10 мм², то младший примерно на 2 мм² меньше. Но для таких чипов, как Tegra 4i, даже эти два квадратных миллиметра площади очень важны из-за вопросов себестоимости и потребления, поэтому GPU в младшем варианте все-таки решили упростить.
Интересно, что такая сравнительная близость Tegra 4 и Tegra 4i по характеристикам позволяет создавать игры для TegraZone одновременно для обеих моделей SoC, причем младшая не сильно уступит старшей во многих графических задачах. Впрочем, вопросы графической производительности весьма сложны, и мы пока готовы обсуждать их лишь с точки зрения самой NVIDIA. Причем пока что обнародованы данные лишь по старшему решению. В любом случае, такие шаги NVIDIA позволят дополнительно улучшить графику мобильных игр, добавив столь недостающие эффекты, знакомые нам по «большим» играм.
NVIDIA приводит некоторые данные графической производительности для сравнения их Tegra 4 с уже существущими на рынке решениями, имеющими мощные GPU-ядра Qualcomm, ARM и PowerVR. Эффективность данных GPU предлагается оценить как по теоретическим параметрам производительности видеоядер (филлрейт и вычислительная производительность), так и по одному из общепринятых 3D-бенчмарков — GLBench 2.5.
Все площади GPU даны по оценке NVIDIA и приведены (простой нормализацией) к техпроцессу 28 нм. По филлрейту топовое решение NVIDIA несколько уступает лучшему из конкурентов в абсолютных цифрах, но значительно выигрывает в эффективности. Еще бо́льшая разница есть в вычислительной производительности — тут Tegra 4 впереди как в абсолютном зачете, так и по эффективности. Что касается синтетического бенчмарка, то и в нем NVIDIA отмечает большой отрыв своего решения. Все эти цифры гораздо нагляднее выглядят на диаграмме:
Но что если сравнить Tegra 4 не с давно вышедшими решениями, а с уже анонсированными, но пока что не продающимися на рынке — ровно так же, как и сама Tegra 4? Компания приводит такие данные, сравнивая свой лучший мобильный GPU с видеоядрами Snapdragon серий S4 Pro и 800 в синтетических же бенчмарках:
Измерения скорости рендеринга уже вышедших продуктов были сделаны в разрешении Full HD, в качестве телефона с S4 Pro APQ8064 использовался HTC DNA, а Snapdragon 800 (серии 8x74) был проинтерполирован в соответствии с маркетинговыми заявлениями Qualcomm (такими же маркетинговыми, как и заявления NVIDIA по Tegra 4, кстати). В случае Tegra 4 использовалась референсная платформа NVIDIA.
Как видите, по этим примерным прикидкам видеоядро Tegra 4 должно остаться впереди соответствующего Adreno, хотя как оно будет в реальности — пока что неизвестно. Ни тех ни других чипов в уже продающихся смартфонах или планшетах пока нет. Будем ждать их появления и обязательно протестируем.
Вполне естественно, что улучшения эффективности всех блоков в семействе Tegra 4 сказались и на экономичности и эффективности системы целиком. Еще одним сравнением со смартфоном HTC DNA на базе топового решения Qualcomm NVIDIA решила показать выгоду в экономичности. Tegra 4 (и это старшее решение), по измерениям компании, является однокристальной системой, потребляющей меньше энергии, чем любая из существующих топовых. Вот это самое сравнение с конкурентом:
В данном случае показано потребление всей платформы в милливаттах, дисплеи приведены к одинаковой яркости, в качестве смартфона на Tegra 4 использовалась референсная платформа NVIDIA, и время работы батареи считалось для емкости в 2500 мА·ч. В некоторых режимах разница получилась больше (особенно радует режим простоя, столь важный для мобильных устройств), в других — меньше, но можно точно утверждать, что Tegra 4 явно потребляет мало энергии. Что уж говорить о Tegra 4i… Еще одним недостатком, который приписывали Tegra 3, в новых решениях стало меньше.
Переходим к следующему недостатку — отсутствию интегрированной модемной части в SoC NVIDIA. Да, все предыдущие Tegra требовали отдельного чипа для поддержки сетей передачи данных, но компанию Icera они купили явно не случайно, и потихоньку работали над своими ошибками. Недавно мы рассказывали вам о софт-модемном чипе Icera i500, который имеет некоторые преимущества, так вот их теперь стало еще больше — в состав Tegra 4i включен такой же софт-модем с поддержкой мобильных сетей четвертого поколения LTE.
Мы не будем в данном материале подробно останавливаться на преимуществах данного решения NVIDIA, достаточно того, что они декларируют большую гибкость в поддержке новых стандартов и на 40% меньшую площадь по сравнению с решением конкурента — Qualcomm MDM9215.
Итак, основные отличия Tegra 4i от Tegra 4 заключаются в том, что в младшем брате применяются менее производительные, но более эффективные CPU-ядра, работающие на большей частоте. Младшая модель GPU имеет несколько иную конфигурацию, с меньшей производительностью, но большей эффективностью. Также Tegra 4i поддерживает до 2 ГБ памяти LPDDR3 в отличие от 4 ГБ DDR3L/ LPDDR3 у Tegra 4 и включает встроенный в чип модем с поддержкой LTE. Это отличное решение, и оно должно стать популярным среди производителей смартфонов.
В планшетах позиции NVIDIA и так сильны, и Tegra 4 поможет их удержать. А вот для того чтобы упростить Tegra 4i выход на рынок, NVIDIA выпустила референсную платформу Phoenix — та позволит производителям сравнительно быстро выпускать решения на базе новых чипов NVIDIA, и это должно сократить время выхода на рынок для смартфонов, чего Tegra до сих пор также не хватало.
К слову, референсный дизайн Phoenix выглядит как типичный современный смартфон с большим экраном, поддержкой разрешения Full HD, режимом экономии энергии второго поколения PRISM 2, имеет встроенный модем 4G LTE, поддержку архитектуры вычислительной фотографии NVIDIA Chimera, о которой мы уже писали в предварительном обзоре, и при всем этом имеет небольшую толщину в 8 мм (при аккумуляторе типичной емкости на сегодняшний день).
Как бы подводя итог нашей небольшой статьи, отметим, что если в случае Tegra 4 у NVIDIA получился отличный чип для планшетов и топовых смартфонов, которые требовательны, прежде всего, к производительности CPU и GPU, то Tegra 4i стал высокоинтегрированным чипом для производительных смартфонов с просто отличными показателями скорости и эффективности, во многом превосходящими своих собратьев и конкурентов. Младшая система-на-чипе имеет четыре CPU-ядра, работающих на частоте 2,3 ГГц, имеет графическое ядро из 60 ALU, незначительно уступающее старшему решению, а также встроенный LTE-модем, который известен нам по Tegra 4, только теперь его поместили в тот же один кристалл. Причем наполовину меньшего размера — по сравнению с текущими чипами основных конкурентов.
На этом наше краткое знакомство с некоторыми новыми деталями линейки Tegra 4 завершено, и мы обязательно обновим в ближайшее время нашу предварительную статью по Tegra 4 новыми данными, дополнив статью всем необходимым.