Facebook verbessert AI-Bildbeschreibungen für sehbehinderte Benutzer

Facebook hat das KI-Modell, mit dem Blinde und Sehbehinderte Bilder auf der Plattform identifizieren können, erheblich verbessert. Die Aktualisierungen dieses KI-Tools haben es noch zuverlässiger gemacht, genaue Beschreibungen für Bilder bereitzustellen.

Facebook enthüllt die "nächste Generation" von automatischem Alternativtext

In einer über Facebook Blog – Post, skizzierte Face die Veränderungen , die sie zu ihrem Bild identifizierte gemacht AI – Tool. Facebook nennt diese Technologie automatischen Alternativtext (AAT).

Verwandte: Facebooks neue KI übersetzt zwischen 100 Sprachen

Dieses KI-System wurde ursprünglich im Jahr 2016 eingeführt und ermöglicht es Sehbehinderten seitdem, mithilfe von Bildschirmlesegeräten von KI erzeugte Beschreibungen von Bildern zu hören. Jetzt stellt Facebook "die nächste Generation" von AAT vor.

Facebook hat die Anzahl der Elemente und Konzepte verbessert, die seine KI zuverlässig erkennen kann. Es wurde auch daran gearbeitet, diese Beschreibungen spezifischer zu gestalten, da die KI jetzt die Tiere, Aktivitäten und Orientierungspunkte auf einem Foto erkennen kann. Als Beispiel könnte eine Beschreibung lauten: "Kann ein Selfie von 2 Personen im Freien sein, der Schiefe Turm von Pisa."

Facebook verbessert AI-Bildbeschreibungen für sehbehinderte Benutzer - facebook ai alt text

Das KI-Werkzeug kann sogar den Positionsort und die Größe der Elemente auf einem Foto identifizieren. Auf diese Weise kann das Tool ein besseres Bild davon zeichnen, wie das Foto tatsächlich aussieht. Bisher beschränkte sich das System darauf, vage Beschreibungen bereitzustellen, die nicht die Position von Personen und Objekten in einem Bild enthielten.

Facebook erreichte diesen neuen Detaillierungsgrad durch die Verwendung eines Modells, das "auf schwach überwachten Daten in Form von Milliarden öffentlicher Instagram-Bilder und deren Hashtags trainiert". Auf diese Weise kann die KI über 1.200 Konzepte genau erkennen, was weit mehr ist als das ursprüngliche Tool.

Trotz dieser verbesserten Genauigkeit lässt Facebook immer noch Raum für Fehler. Aus diesem Grund steht vor jeder Fotobeschreibung der Ausdruck "möglicherweise", falls das Tool den Inhalt des Bildes nicht korrekt meldet.

Facebook wies auf die positiven Auswirkungen dieses Updates auf die Community hin und erklärte:

Diese Verbesserungen helfen Benutzern, die blind oder sehbehindert sind, besser zu verstehen, was auf Fotos von ihrer Familie und ihren Freunden – und auf ihren eigenen Fotos – zu sehen ist, indem sie detailliertere Informationen bereitstellen.

Wegbereiter für Online-Zugänglichkeit

Das neue und verbesserte KI-Tool von Facebook ist vielversprechend für das Wachstum der Barrierefreiheits-Tools im Internet und setzt einen neuen Standard für die Barrierefreiheit in sozialen Medien. Hoffentlich werden andere Plattformen ein ähnliches Tool implementieren, da es eine enorme Hilfe für sehbehinderte Benutzer wäre.