Новият AI асистент на Meta черпи информация от публичните данни на Facebook и Instagram

Meta Platforms е използвала публични съобщения от Facebook и Instagram, за да обучи части от своя нов виртуален асистент Meta AI. За да запази поверителността на потребителите, компанията e изключила личните съобщения, споделени само със семейството и приятелите. Това съобщи в интервю за Ройтерс директорът на компанията, отговарящ за нейните политики.

Президентът по глобалните въпроси Ник Клег сподели по време на годишната конференция на компанията, която се проведе през тази седмица, че Meta не е използвала лични чатове в своите услуги за изпращане на съобщения като данни за обучение на модела.

„Опитахме се да изключим масиви от данни, в които преобладава личната информация“, посочи Клег, като добави още, че „по-голямата част“ от данните, използвани от Meta за обучение, са публично достъпни.

Той посочи LinkedIn като пример за уебсайт, чието съдържание Meta умишлено е избрала да не използва поради опасения за поверителността.

Коментарите на Клег идват в момент, когато технологични компании, сред които Meta, OpenAI и Google на Alphabet, са критикувани за това, че използват информация, извлечена от интернет без позволение. След което обучават своите моделите за изкуствен интелект, които поглъщат огромни количества данни, за да обобщават информация и да генерират изображения.

Компаниите обмислят как да се справят с извлечените в този процес материали, които са лични или защитени с авторски права, притеснени от това, че техните системи с изкуствен интелект могат да възпроизведат. В същото време са изправени пред редица съдебни искове от автори, които ги обвиняват в нарушаване на авторските права.

По време на годишната конференцията за продукти на Meta – Connect в сряда, главният изпълнителен директор на компанията Марк Зукърбърг представи Meta AI – най-значимият продукт сред първите ориентирани към потребителите инструменти с изкуствен интелект. На тазгодишното събитие преобладаваха разговорите за изкуствен интелект, за разлика от предишни конференции, които се фокусираха върху добавената и виртуалната реалност.

Meta е разработила асистента, като е използвала персонализиран модел, базиран на мощния голям езиков модел Llama 2, който компанията пусна за публична търговска употреба през месец юли. Както и нов модел, наречен Emu, който генерира изображения в отговор на текстови команди.

Продуктът ще може да генерира текст, аудио и изображения и ще има достъп до информация в реално време чрез партньорство с търсачката Bing на Microsoft.

Публичните публикации във Facebook и Instagram, които са били използвани за обучение на Meta AI, са включвали както текст, така и снимки, заяви Клег.

Въпросните публикации са били използвани за обучението на Emu за генериране на елементи от продукта, докато функциите за чат са базирани на Llama 2, с някои добавени публично достъпни и анотирани масиви от данни, коментира говорител на Meta пред Ройтерс.

Възможно е за в бъдеще да се използват и интеракции с Meta AI за подобряване на функциите, добави говорителят.

Клег заяви, че Meta е наложила ограничения за безопасност по отношение на съдържанието, което инструментът Meta AI може да генерира, като например забрана за създаване на фотореалистични изображения на публични личности.

Някои компании, разполагащи с инструменти за генериране на изображения, улесняват възпроизвеждането на емблематични герои като Мики Маус, докато други са платили за материалите или умишлено избягват включването им в данните за обучение.

Това лято например OpenAI подписа шестгодишен договор с доставчика на съдържание Shutterstock, за да използва библиотеките с изображения, видеоклипове и музика на компанията за обучение.

Запитан дали Meta е предприела подобни стъпки, за да избегне възпроизвеждането на изображения, защитени с авторски права, говорител на Meta посочи новите условия за ползване на услугата. Te забраняват на потребителите да генерират съдържание, нарушаващо правата на личен живот и интелектуална собственост.