Я люблю використовувати телефон Google Pixel, але голосовий набір може бути найпомітнішим покращенням на цих пристроях. Кожного разу, коли я намагаюся перейти на інший Android-пристрій, я відчуваю, як важко повернутися, адже досвід голосового набору на Pixel значно кращий. Але, нарешті, є надія на покращення.
Gboard — основна клавіатура Android, яка має вбудований голосовий набір. Вона працює досить добре, але на Pixel вона просто вражає. Google вперше покращив цю функцію понад п’ять років тому, і з тих пір досвід на Pixel став не лише швидшим, але й точнішим. Це робить голосовий набір на Pixel значно кращим, ніж на будь-якому іншому Android-пристрої.
Це стосується навіть різних клавіатур. Gboard на Pixel і Gboard на Samsung Galaxy — це два абсолютно різні досвіди. Версія на інших Android-пристроях не підтримує пунктуацію (без вимови знаків), часто потребує більше часу для завантаження і рідко є такою точною. Хоча, звісно, є й гірші варіанти, як, наприклад, голосовий набір Samsung Keyboard.
Але, здається, рішення вже на горизонті.
Це штучний інтелект.
Я не завжди впевнений у застосуванні штучного інтелекту, але якщо є щось, в чому LLM (великі мовні моделі) дійсно хороші, так це текст. Тому голосовий набір став дуже популярним застосуванням штучного інтелекту. Google, по суті, був попереду всіх з покращеним голосовим набором на Pixel, що стало можливим завдяки машинному навчанню.
Одним з перших сервісів, який я почав використовувати, був “Wispr Flow” — сервіс голосового набору, що працює на базі штучного інтелекту, який запустили на Android на початку цього року.
Цей сервіс має дві основні переваги. По-перше, Flow не замінює Gboard або будь-яку іншу клавіатуру, яку ви хочете використовувати. Він працює як плаваюча кнопка/вікно поверх інших додатків. Це може вимагати деякого часу, щоб звикнути до нової кнопки, але це дійсно хороше рішення. Кнопка з’являється в залежності від того, який додаток ви використовуєте.
Натискання кнопки запускає голосовий набір, а натискання галочки обробляє текст і вставляє його у ваше активне текстове поле. Я б хотів, щоб він показував попередній перегляд тексту, але в цілому це працює досить добре.
Однак є й недоліки. Вам потрібно надати Wispr Flow додаткові дозволи, такі як можливість відображення поверх інших додатків. Це призводить до появи сповіщень у панелі. Я швидко вимкнув постійне сповіщення через налаштування Android, але це трохи дратує.
Вам також потрібно довіряти Wispr у плані конфіденційності. Додаток має “Приватний режим”, який обіцяє зберігати дані лише на вашому пристрої.



Проте, фактична продуктивність більше ніж компенсує ці недоліки.
Я використовую це на своєму Galaxy Z Fold 7 — моєму основному телефоні, який постійно нагадує мені, наскільки поганий голосовий набір Gboard на інших пристроях. Я вражений, як добре це працює. Модель голосового набору тут неймовірно точна, здатна ідеально транскрибувати те, що я кажу, незалежно від контексту. Хоча це не безпомилково, з часом я помічаю, що точність дуже близька до досвіду на Pixel.
Основна перевага Flow в тому, що він краще розуміє контекст. Додаток автоматично виправляє фрази, які можуть бути недоречними. У майбутньому Flow підтримуватиме користувацький словник та інші способи налаштування виходу, але мені подобається те, що є.
Але, як вже згадувалося, Flow має великий недолік — він не є рідним.
Тому наступний крок тут — це технологія, яку я можу легко уявити, що інші бренди Android захочуть використовувати. Нещодавно запустили “Essential Voice”, що є рідним Wispr Flow для телефонів Nothing. Це знижує витрати, а також краще інтегрує голосовий набір у ваш звичайний досвід.
Здається, що інші бренди Android також підуть цим шляхом. Оскільки всі намагаються впровадити штучний інтелект у все, покращення голосового набору — це справжній хіт.
Цікавий факт
Голосовий набір на Google Pixel став популярним завдяки використанню машинного навчання, що дозволяє значно покращити точність і швидкість.



