Meta представила нову модель штучного інтелекту, здатну навчати інші моделі без необхідності залучення людини.

Meta запустила кілька нових моделей штучного інтелекту. Одна із них працює за принципом "оцінювач-самоучка", і може навчати інший штучний інтелект без участі людини. Компанія очікує, що це підвищить ефективність для підприємств, які використовують великі мовні моделі, повідомив Reuters.

У серпні компанія оголосила про намір випустити нову модель штучного інтелекту, яка використовує аналогічний підхід "ланцюга думок", застосований в удосконаленій версії o1 від OpenAI. Ця нейронна мережа, що проходила навчання за методом підкріплення аргументації, здатна здійснювати складні логічні міркування і формувати тривалі внутрішні ланцюги думок під час аналізу даних.

Співробітники дослідницького підрозділу Metа, які займалися навчанням моделі оцінювача використовували дані, згенеровані іншим штучним інтелектом, виключивши вплив людини на цьому етапі.

Цей метод прокладає шлях до розвитку автономних ШІ-агентів, які можуть вчитися на власних помилках, зазначили вони в коментарі для Reuters.

Моделі, що здатні до самовдосконалення, усувають потребу в витратному та неефективному процесі "навчання з підкріпленням за допомогою людського зворотного зв’язку". Читати детальніше за посиланням: https://ms.detector.media/it-kompanii/post/36496/2024-10-21-meta-vypustyla-shi-model-yaka-mozhe-navchaty-inshu-bez-uchasti-lyudyny/