Microsoft Word, Outlook en PowerPoint krijgen AI-aangedreven Auto Image Captioning Tool getraind in grote datasets na Azure Services
Microsoft heeft bevestigd dat het een krachtig en slim ondertitelingssysteem voor afbeeldingen heeft ontwikkeld. Het AI-aangedreven systeem kan snel en autonoom relevante kationen van afbeeldingen genereren. Het systeem is misschien niet zo vloeiend of creatief als mensen die bijschriften voor afbeeldingen maken, maar het is naar verluidt getraind op enorme datasets om de relevantie en nauwkeurigheid te verbeteren. Microsoft verzekert dat het systeem twee keer zo krachtig is als het gangbare systeem dat wordt gebruikt in de diensten van het bedrijf.
Microsoft heeft een nieuw automatisch ondertitelingssysteem voor afbeeldingen. Het systeem wordt als eerste gestart in Azure Cognitive Services. Microsoft heeft echter aangegeven dat hetzelfde zal doorsijpelen naar Microsoft Word, Outlook en PowerPoint.
Hoe werkt het nieuwe AI-Drive Image Captioning-systeem?
Elk AI-gestuurd systeem moet eerst worden getraind op relevante datasets. Deze algoritmen leren van de datapunten en krijgen vervolgens het vermogen om de verwachte gedragspatronen na te bootsen. Ook het nieuwe automatische ondertitelingssysteem van Microsoft is naar verluidt getraind met een enorme dataset van afbeeldingen die zijn gekoppeld aan woordtags. Deze woordtags zijn toegewezen aan een afzonderlijk object in een afbeelding.
Na de initiële training hebben de onderzoekers het vooraf getrainde model verfijnd voor ondertiteling van de reeds ondertitelde afbeeldingendataset. Door het training- en afstemmingsproces leerde het AI-model een begrijpelijke zin samen te stellen. Het nieuwe AI-model maakt vervolgens gebruik van het visuele vocabulaire om zelf bijschriften te genereren voor afbeeldingen die nieuwe of afzonderlijke objecten bevatten. Het lijkt erop dat de nadruk ligt op het object dat specifiek of uniek is in de afbeelding.
Zoals bij alle AI-modellen, is zelfs het ondertitelingssysteem van Microsoft niet 100 procent nauwkeurig of perfect. Microsoft verzekert echter dat het nieuwe AI-model twee keer zo goed is als het ondertitelingsmodel voor afbeeldingen dat momenteel wordt gebruikt in de producten en diensten van het bedrijf. Interne tests geven aan dat het nieuwe model ondertitels kan maken die meer beschrijvend en nauwkeuriger zijn dan de bijschriften die handmatig door mensen zijn geschreven, beweert Xuedong Huang, een technische medewerker van Microsoft en de chief technology officer van Azure AI Cognitive Services in Redmond, Washington,
"We brengen deze AI-doorbraak naar Azure als een platform om een bredere groep klanten te bedienen. Het is niet alleen een doorbraak in het onderzoek; de tijd die nodig was om die doorbraak om te zetten in productie op Azure, is ook een doorbraak. "
Wat Huang aangaf was dat Microsoft in staat is geweest om de ontwikkeling, verfijning en inzet van AI-modellen die kunnen concurreren met door mensen gegenereerde inhoud aanzienlijk te versnellen. Het is echter belangrijk op te merken dat deze modellen meestal een specifieke set richtlijnen volgen en sterk afhankelijk zijn van de datasets.
Microsoft heeft de afgelopen jaren hard gewerkt om de kracht van AI in verschillende van zijn producten en services te brengen. AI heeft de kracht om de productiviteit te verhogen en tegelijkertijd mensen vrij te maken om creatievere taken uit te voeren. Interessant is dat Microsoft ernaar streeft alle gebruikers te helpen toegang te krijgen tot de essentiële inhoud in elk beeld voor mensen met een visuele beperking door middel van het nieuwe automatische ondertitelingssysteem.