Приховані файли кореневого рівня, виявлені в Android, активують Gemini AI безпосередньо в програмі пошуку Google
Студент і дослідник, який оприлюднив приховані функції Android, виявив налаштування глибоко в кореневих файлах Android, які вмикають Google Gemini безпосередньо з пошуку Google у спосіб, який нагадує Apple iOS, викликаючи запитання про те, чому це там і чи могло це бути пов’язаний із загальним впровадженням штучного інтелекту в пошуку, за чутками, у травні 2024 року.
Чутки про Близнюки в пошуку
Ходять лише чутки, що буде розгорнуто певну форму пошуку AI. Але якщо Google запровадить доступ до Gemini як стандартну функцію, то наступне дає уявлення про те, чого чекає пошукова спільнота.
Gemini — це найпотужніша модель штучного інтелекту від Google, яка містить передове навчання, технології та функції, які багато в чому виходять за межі існуючих моделей.
Наприклад, Gemini є першою моделлю штучного інтелекту, яка була навчена бути мультимодальним. Мультимодальний означає здатність працювати з зображеннями, текстом, відео та аудіо та отримувати знання з кожної з різних форм медіа. Усі попередні моделі штучного інтелекту були навчені бути мультимодальними з окремими компонентами, а потім окремі частини з’єднувалися разом. За даними Google, старий спосіб навчання мультимодальності не працював добре для складних завдань міркування. Однак Близнюки попередньо навчені мультимодальності, що дозволяє йому мати складні здібності до міркування, які перевершують здібності всіх попередніх моделей.
Іншим прикладом розширених можливостей Gemini є безпрецедентний масштаб контекстного вікна. Контекстне вікно — це кількість даних, які мовна модель може розглядати одночасно, щоб прийняти рішення. Контекстне вікно є одним із показників потужності мовної моделі. Контекстні вікна вимірюються в “токенах” які являють собою найменшу одиницю інформації.
Порівняння контекстних вікон
- ChatGPT має максимальне контекстне вікно 32k
- GPT-4 Turbo має контекстне вікно 128k
- Gemini 1.5 pro має контекстне вікно в один мільйон токенів.
Щоб побачити це контекстне вікно в перспективі, контекстне вікно Gemini дозволяє обробити весь текст трьох книг «Володар перснів» або десять годин відео та поставити будь-яке запитання щодо цього. Для порівняння, найкраще контекстне вікно OpenAI&rsquo у 128 Кб здатне розглянути 198 сторінок книги Робінзона Крузо або приблизно 1600 твітів.
Внутрішнє дослідження Google показало, що їхні передові технології дозволяють створювати контекстні вікна розміром до 10 мільйонів токенів.
Витік функцій нагадує реалізацію iOS
Було виявлено, що Android містить спосіб доступу до штучного інтелекту Gemini безпосередньо з панелі пошуку в додатку Google так само, як це доступно в мобільних пристроях Apple.
Офіційні вказівки щодо пристрою Apple відображають функціональність, яку дослідник виявив прихованою в Android.
Ось як описано доступ до iOS Gemini:
“На iPhone ви можете спілкуватися з Gemini у програмі Google. Доторкнувшись до вкладки Gemini, відкрийте абсолютно новий спосіб навчання, створення зображень і отримання допомоги, поки ви в дорозі. Взаємодійте з ним за допомогою тексту, голосу, зображень і камери, щоб отримати допомогу новими способами.”
Дослідник, який вилив функціональність Gemini у пошук Google, виявив її приховану в Android. Увімкнення цієї функції спричинило появу перемикача на панелі пошуку Google, за допомогою якого користувачі можуть легко отримати прямий доступ до функцій Gemini AI, як і в iOS.
Увімкнення цієї функції потребує рутування телефону Android, що означає доступ до операційної системи на найфундаментальнішому рівні файлів.
За словами особи, яка злила інформацію, однією з вимог до перемикача є те, що Gemini вже має бути ввімкнено як мобільний помічник. Додаток під назвою GMS Flags також має бути встановлено, щоб мати змогу вмикати та вимикати функції додатка Google.
Вимоги такі:
“Обов’язкові речі –
Рутовані пристрої під управлінням Android 12+
Остання бета-версія Google App із Play Store або Apkmirror
Програму GMS Flags встановлено з наданими правами root. (GitHub)
Gemini вже має бути доступним для вас у вашому додатку Google.”
Знімок екрана нового перемикача пошуку
Знімок екрана, на якому виділено ‘перемикач’ кнопку в інтерфейсі користувача з червоною стрілкою, яка вказує на неї, з рядком пошуку Google, видимим у фоновому режимі, і фрагментом програми, пов’язаної з фінансами, внизу.
Скріншот Gemini, активованого в пошуку Google
Людина, яка розкрила цю функцію, написала у Twitter:
“Програма Google для Android незабаром отримає перемикання між Gemini та Пошуком [як на iOS]”
Програма Google для Android незабаром отримає перемикач для перемикання між Gemini та Пошуком [як на iOS]
? Прочитати – https://t.co/eMgD2NxZKX#Google #Android pic.twitter.com/i19Msjb8wm
— AssembleDebug (@AssembleDebug) 7 квітня 2024 р.
Google має намір оголосити про офіційний запуск SGE?
Ходили чутки, що Google збирається оголосити про офіційний запуск Google Search Generative Experience на травневій конференції I/O у травні 2024 року, де Google регулярно оголошує про нові функції для пошуку (серед інших оголошень).
Елі Шварц нещодавно опублікував на LinkedIn про чутки про розгортання SGE:
“Ця дата надійшла не від Google PR; однак станом на минулий тиждень це поточна запланована дата внутрішнього запуску. Звичайно, хронологія все ще може змінитися, враховуючи те, що до цього залишилося 53 дні. Протягом останнього року було пропущено кілька дат запуску.
…Крім того, важливо уточнити, що саме “запускає” засоби.
Наразі єдиний спосіб побачити SGE, якщо ви не берете участь у бета-експерименті, це ввімкнути лабораторії.
Запуск означає, що вони покажуть SGE людям, які не зареєструвалися, але масштаби цього можуть сильно відрізнятися.”
Невідомо, чи цей прихований перемикач є маркером місця для майбутньої версії програми пошуку Google, чи це щось, що дозволяє розгортати SGE у майбутніх даних.
Однак цей прихований перемикач дійсно пропонує можливу підказку для тих, хто цікавиться тим, як Google може розгорнути інтерфейс на основі штучного інтелекту для пошуку, і чи є цей перемикач певним чином з’єднувачем цієї функції.