«Android Bench» для оцінки AI моделей, що використовуються в розробці Android додатків, було оновлено, і остання модель OpenAI тепер ділить перше місце з Gemini.

Перший раз «Android Bench» був представлений у березні, і це ресурс Google для вимірювання найкращих AI моделей для кодування Android додатків. Методологія Google включає в себе оцінку того, як моделі працюють з Jetpack Compose для UI, Coroutines і Flows для асинхронного програмування, room для зберігання даних та hilt для впровадження залежностей, серед інших факторів.
У першому оновленні цього списку Google додав дві нові моделі: GPT 5.4 та GPT 5.3 Codex, які швидко піднялися до верхніх позицій.
Найкращі AI для розробки Android додатків, згідно з Google (4/9/26)
- Новинка: GPT 5.4: 72.4%
- Gemini 3.1 Pro Preview: 72.4%
- Новинка: GPT 5.3-Codex: 67.7%
- Claude Opus 4.6: 66.6%
- GPT-5.2 Codex: 62.5%
- Claude Opus 4.5: 61.9%
- Gemini 3 Pro Preview: 60.4%
- Claude Sonnet 4.6: 58.4%
- Claude Sonnet 4.5: 54.2%
- Gemini 3 Flash Preview: 42%
- Gemini 2.5 Flash: 16.1%
Решта списку цього разу не змінилася, результати залишилися з кінця лютого в тому первинному запуску. Останні моделі OpenAI були протестовані в середині березня перед цим тижнем, коли були опубліковані результати.
Звичайно, ці результати не слід вважати абсолютною правдою. Як і з будь-яким бенчмарком, реальність часто відрізняється від контрольних тестів. Є безліч змінних, чому одна модель може працювати краще для вас, ніж інша, включаючи робочий процес, цінність та інше.
Google спочатку заявив, що його мета в публікації цих результатів – допомогти розробникам стати «більш продуктивними» і, в кінцевому підсумку, забезпечити «вищу якість додатків в екосистемі Android».
Цікавий факт
Відомо, що AI моделі, такі як GPT, використовуються не лише для кодування, але й для створення контенту, що може вплинути на різні сфери, включаючи журналістику та маркетинг.



