ARM Trillium: мобильные со-процессоры для машинного обучения и распознавания лиц
Сегодня ARM анонсировала проект Trillium, в рамках которого представила два со-процессора. Один из них предназначен для аппаратного ускорения принятия решений (inferencing) в задачах машинного обучения и обещает производительность на уровне 3 TOPs (трлн. операций глубокого обучения) на один Вт (с точностью INT8). Из расчета энергопотребления на уровне около 1.5 Вт скорость операций превысит 4.6 TOPs.
Другой со-процессор выполняет аппаратное ускорение распознавания изображений (например, лиц на фотографиях), причем производительность выросла до 80 раз (по сравнению с традиционными DSP, процессорами цифрового сигнала) при одновременном значительном улучшении качества распознавания (по сравнению с прежними технологиями ARM).
Как уже рассказывал Gadgets News, аппаратное ускорение машинного обучение и/или распознавания изображений используется, в частности, в мобильных процессорах Kirin 970 (Huawei), A11 Bionic (Apple) и Exynos 9810 (Samsung). ARM разрабатывает и лицензирует ЦПУ и ГПУ для большинства производителей мобильных процессоров: Qualcomm, Samsung, MediaTek, Huawei. Поэтому не исключено, что следующее поколение их чипов будет оснащено со-процессорами машинного обучения и распознавания изображений, разработанных в ARM.
Напомню, что машинное обучение задействовано, например, в работе голосовых ассистентов (таких как Apple Siri, Google Assistant, Microsoft Cortana, Amazon Alexa, Samsung Bixby или Яндекс Алиса). В настоящее время львиная (если не вся) работа по обработке голосовых запросов пользователей выполняется в облаке, на удаленных серверах этих компаний. Если мобильные процессоры возьмут на себя хотя бы часть этой работы, то это снизит зависимость пользователей от подключения к Интернету.