Google I/O 2024: Nye funktioner med Gemini

Google Gemini AI advanced
Google I/O 2024 eventet i går var ikke overraskende fyldt med AI tiltag med stort fokus på Googles Gemini.

Google siger, at de er trådt ind i Gemini-æraen og har introduceret en overflod af opdateringer og funktioner til deres tjenester, alt sammen drevet af Gemini.

Google afsluttede sin første dag på I/O 2024 med en masse nye AI-annonceringer relateret til Gemini og hvordan det vil gøre verden klogere og mere bekvemt for mennesker. Gemini er ved at blive dybere forankret i Googles produkter og tjenester, såsom Android-operativsystemet, Google Workspace-apps og meget mere. Her er en opsummering af alle de annonceringer, der fandt sted på Google I/O 2024.

Nu kan du bruge funktionen "Spørg Fotos" i Google Fotos-appen for at finde de billeder, du har brug for. Geminis multimodale evner kan forstå konteksten og emnet for billeder for at trække detaljer ud. For eksempel kan du spørge: "Hvilke temaer har vi haft til Lenas fødselsdagsfester?". Spørg Fotos vil forstå detaljer som hvad der er i baggrunden eller på fødselsdagskagen for at give dig svaret.

Det er også nemmere at få opgaver udført i Google Fotos med hjælp fra Gemini-modeller. For eksempel kan Spørg Fotos hjælpe dig med at oprette et højdepunkt fra din tur mere let, efter at du er kommet hjem fra din lange tur med venner eller familie. Alt hvad du skal gøre er at spørge, og den vil foreslå topbilleder - og endda skrive en personlig billedtekst til deling på sociale medier. Google bekræfter desuden, at dine personlige data i Google Fotos aldrig bruges til reklamer.

Spørg Fotos er en eksperimentel funktion, som vi snart begynder at udrulle, med flere funktioner på vej.


Gemini 1.5 Pro og Gemini 1.5 Flash

Google introducerede for et stykke tid siden Gemini 1.5 Pro, men indså behovet for lavere latency og lavere omkostninger at servicere i nogle applikationer. Som et resultat var en af annonceringerne på Google I/O 2024 Gemini 1.5 Flash, som er lettere, men er designet til at være lige så hurtig og effektiv som 1.5 Pro til at servicere i stor skala. Mens det er en lettere model end 1.5 Pro, er den meget kapabel til multimodal logisk tænkning på tværs af store mængder information og leverer imponerende kvalitet for sin størrelse.

Både 1.5 Pro og 1.5 Flash er tilgængelige i offentlig preview med et 1 million tokens kontekstvindue i Google AI Studio og Vertex AI. Og nu er 1.5 Pro også tilgængelig med et 2 million tokens kontekstvindue via venteliste til udviklere, der bruger API'en og til Google Cloud-kunder.

Udover at udvide sit kontekstvindue til 2 million tokens, har Google også forbedret sin kodegenerering, logisk tænkning og planlægning, flertrinssamtaler og forståelse af lyd og billede gennem data og algoritmiske fremskridt.

Gemini Nano udvider sig ud over tekstbaserede input til også at omfatte billeder. Startende med Pixel vil applikationer, der bruger Gemini Nano med multimodalitet, være i stand til at forstå input ikke kun gennem tekst, men også gennem syn, lyd og talesprog.

Gemma 2 er Googles næste generation af åbne modeller til ansvarlig AI-innovation. Gemma 2-modellen har en ny arkitektur designet til gennembrudspræstation og effektivitet og vil være tilgængelig i nye størrelser. Gemma er en familie af åbne modeller, der er bygget ud fra den samme forskning og teknologi, der er brugt til at skabe Gemini-modellerne.

Vores partnere