Apple без разрешения использовала видео с YouTube для обучения своего ИИ
в iCases BlogОб этом говорится в расследовании Proof News и Wired.
Компания Apple, а также другие крупные технологические компании использовали субтитры YouTube для обучения моделей искусственного интеллекта, как показало расследование, проведенное в четверг, развеяв опасения по поводу использования данных для обучения моделей ИИ.
В расследовании Wired, проведенном ранее на этой неделе, сообщалось, что более 170 000 видеороликов от популярных создателей контента были частью набора данных, используемого для обучения моделей искусственного интеллекта. Apple специально использовала этот набор данных при разработке своей модели OpenELM с открытым исходным кодом, о которой она объявила в апреле.
Однако теперь Apple подтвердила изданию 9to5Mac, что OpenELM не работает ни с одной из ее функций искусственного интеллекта или машинного обучения, включая Apple Intelligence. Apple объяснила, что OpenELM был создан исключительно в исследовательских целях, чтобы продвинуть разработку крупномасштабных языковых моделей с открытым исходным кодом.
Выпуская OpenELM на Hugging Face Hub, сообществе для обмена кодом искусственного интеллекта, исследователи Apple назвали его «совместной языковой моделью с открытым исходным кодом», призванной «расширить возможности и обогатить сообщество исследователей с открытым исходным кодом». пояснили они. Модель также доступна на сайте Apple Machine Learning Research. Apple заявила, что не планирует разрабатывать новую версию модели OpenELM.
Компания подчеркнула, что OpenELM не интегрирована в Apple Intelligence и что набор данных «YouTube Subtitles» не используется для работы ее коммерческих возможностей искусственного интеллекта. Apple подтвердила свое предыдущее заявление о том, что модели Apple Intelligence обучаются на «лицензированных данных, включая данные, отобранные для улучшения конкретных функций, и общедоступные данные, собранные веб-краулерами».
В отчете Wired подробно рассказывается о том, как компании, включая Apple, Anthropic и NVIDIA, использовали набор данных «YouTube Subtitles» для обучения своих моделей искусственного интеллекта. Этот набор данных является частью более крупной коллекции, известной как «The Pile», собранной некоммерческой организацией EleutherAI.