Google maakt zoomen en fotoverbetering werkelijkheid

Je hebt waarschijnlijk fantasiefilms of tv-programma's gezien waarin de hoofdpersoon vraagt om de afbeelding te vergroten en het resultaat te verbeteren - om een gezicht, of een kentekenplaat of een ander belangrijk detail te laten zien. Google's nieuwste kunstmatige intelligentie (AI) systemen, gebaseerd op de zogenaamde diffusiemodellen, zijn in staat om deze truc uit te voeren.

Het is een lastig proces om onder de knie te krijgen, omdat het in wezen details toevoegt aan een afbeelding die de camera oorspronkelijk niet heeft vastgelegd, met behulp van superslimme gissingen op basis van andere, vergelijkbare afbeeldingen.

Kopen Google Reviews

Bij Google wordt deze techniek natuurlijke beeldsynthese genoemd, en in dit specifieke scenario ultrahoge beeldresolutie. Je begint met een kleine, gepixelde foto en eindigt met iets scherps, helders en natuurlijks. Het is misschien niet precies het origineel, maar het is dichtbij genoeg om er echt uit te zien voor het menselijk oog.

Google heeft voor deze klus twee nieuwe AI-tools geïntroduceerd. De eerste heet SR3, of Super-Resolution via Repeated Refinement, en werkt door ruis aan een afbeelding toe te voegen en deze vervolgens te verwijderen. Door een reeks probabilistische berekeningen op basis van een grote database met afbeeldingen en wat machine learning-magie, kan de SR3 zich voorstellen hoe een versie met een superhoge resolutie van een pixelafbeelding met een lage resolutie eruitziet.

De tweede tool is CDM, oftewel Cascaded Diffusion Models. Google omschrijft deze als "pijplijnen" waarlangs diffusiemodellen - waaronder SR3 - kunnen worden gestuurd voor hoogwaardige beeldopschaling. Het neemt verbeteringsmodellen en maakt ze in grotere afbeeldingen.

Kopen Google Reviews

Door verschillende verbeteringsmodellen met verschillende resoluties te gebruiken, kan de CDM-benadering volgens Google beter presteren dan alternatieve methoden voor het opschalen van afbeeldingen. De nieuwe AI-engine is getest op ImageNet, een gigantische database met trainingsafbeeldingen die vaak worden gebruikt voor onderzoek naar visuele objectherkenning.

De eindresultaten van SR3 en CDM zijn indrukwekkend. In een standaardtest met 50 menselijke vrijwilligers werden afbeeldingen van menselijke gezichten gegenereerd door SR3 ongeveer 50% van de tijd aangezien voor echte foto's - en gezien het feit dat een ideaal algoritme 50% zou moeten halen, is dat indrukwekkend. Het is de moeite waard om te herhalen dat deze verbeterde afbeeldingen geen exacte overeenkomsten zijn met de originelen, het zijn zorgvuldig berekende simulaties op basis van de wiskunde van waarschijnlijkheid.

Kopen Google Reviews

Google belooft veel meer van zijn nieuwe AI-engines en gerelateerde technologieën - niet alleen in termen van het vergroten van afbeeldingen van gezichten en andere natuurlijke objecten, maar ook op andere gebieden van probabilistische modellering.

Lees ook:

bronwetenschappelijke waarschuwing

Aanmelden

0 Heb je vragen? Stel ze hier.

Ingesloten beoordelingen

Bekijk alle reacties

Andere artikelen

Zoals in de films: Google's nieuwe fotoverwerkings-AI maakt schalen en verbeteren mogelijk

Recent commentaar