Gemini agora é capaz de conversar por ligação e descrever objetos em tempo real Crédito: Reprodução/Freepik

O Google anunciou novos recursos para o Gemini e uma nova versão da inteligência artificial: o Gemini 1.5 Flash, que é mais leve e eficaz para aplicações multimodais. A novidade foi compartilhada durante o Google I/O 2024, evento que começou nessa terça-feira, 14, nos Estados Unidos. A empresa focou a abertura do evento em trazer mais da inteligência artificial generativa, que é assunto no momento. O Gemini 1.5 Flash, concorrente do ChatGPT, conseguiu descrever em tempo real objetos e informações capturadas pela câmera do celular durante uma demonstração. Confira a seguir mais sobre a ferramenta e quais as novidades que ela apresenta.

Gemini: o que é a assistente virtual?

Gemini é o modelo de linguagem de Inteligência Artificial do Google. Ele possui uma estrutura multimodal capaz de realizar diversas tarefas, como transcrições de vídeos, geração de imagens e de gráficos, busca de erros em uma planilha de dados, análise de textos acadêmicos, dentre outras. As novidades da assistente agora são realizar tarefas mais completas e interagir de forma ainda mais presente com o usuário. LEIA TAMBÉM | Inteligência Artificial na mobilidade urbana em 2024

Gemini Ultra, Pro, Nano e Flash: qual a diferença?

Gemini Ultra É a versão mais avançada e completa da IA. Ela é capaz de entender e interpretar imagens e vídeos em diferentes linguagens da expressão humana, incluindo musical, visual e em código. Isso significa que a IA é capaz de descrever uma partitura, por exemplo. O Google diz que, em comparação ao rival GPT-4, o modelo Ultra tem resultados melhores em testes de geração de código em Python, desafios de matemática e respostas sobre conhecimentos gerais. Ele custa R$ 96,99/mês, via assinatura do Google One AI Premium. LEIA TAMBÉM | ChatGPT fica mais rápido e 50% mais barato Gemini Pro

Pensado para desenvolvedores, o Gemini Pro é capaz de entender diferentes idiomas, extrair informações de áudios e de vídeos sem a necessidade de realizar uma transcrição escrita. Sua principal característica é a quantidade de contexto que pode processar. O Gemini 1.5 Pro está disponível ao público em versão “preview” na Vertex AI, plataforma de construção de aplicações de IA voltada para empresas. Gemini Nano O Geminio Nano é uma versão “compacta” dos modelos Pro e Ultra, capaz de rodar diretamente em celulares. Em conjunto com a câmera, ele poderá sugerir filtros e edições que realcem a foto.