Google I/O 2024: Gemini AI udvider generativ AI

Google Imagen 3
Google udvider mulighederne med generativ AI med Gemini AI med nye muligheder for både fotos og video.

Indtil nu har Google Lens været begrænset til fotos for at forstå en forespørgsel, men nu kan du også stille den forespørgsler med en video. Søgning med video sparer dig tid og besvær med at finde de rigtige ord til at beskrive et problem, og du får et AI Overblik med trin og ressourcer til fejlfinding. Søgning med video vil snart være tilgængelig for Søge Labs-brugere på engelsk i USA, og Google vil udvide til flere regioner over tid.

Veo er Googles nyeste videogenereringsmodel, der kan oprette videoer ud fra tekstprompter. Den genererer videoer i høj kvalitet med 1080p opløsning i et bredt udvalg af filmiske og visuelle stilarter, der kan overstige et minut i længden. Man kan give den detaljerede prompter for at få præcis det, de har brug for, og den vil være i stand til at opfylde disse anmodninger med en dyb forståelse af naturligt sprog og visuelle semantik. Veo er tilgængelig for udvalgte skabere i privat preview i VideoFX ved at deltage i en venteliste. I fremtiden vil Veos funktioner også blive integreret inden for YouTube Shorts og andre produkter.

Efterfølgende Imagen 2 er Imagen 3 Googles tekst-til-billedmodel af højeste kvalitet. Den genererer en høj detaljeringsgrad, og producerer fotorealistiske, livagtige billeder med langt færre forstyrrende visuelle artefakter end de tidligere modeller. Imagen 3 forstår bedre det naturlige sprog og hensigten bag din prompt og inkluderer små detaljer fra længere prompter. Modellens avancerede forståelse hjælper den med at mestre en række stilarter. Imagen 3 understøtter også tekstrendering i høj kvalitet. Fra i dag er Imagen 3 tilgængelig for udvalgte skabere i en privat preview i ImageFX og ved at deltage i en venteliste. Imagen 3 vil snart komme til Vertex AI også.

Vores partnere