Google Gemini erleichtert Benutzern mit Seh- und Hörproblemen das Surfen im Internet

Android-Geräte bieten seit Jahren eine integrierte Screenreader-Funktion namens TalkBack . Sie hilft Menschen mit Sehproblemen, die Bildschirminhalte zu verstehen und ermöglicht die Sprachsteuerung. 2024 ergänzte Google die KI Gemini , um Nutzern detailliertere Bildbeschreibungen zu ermöglichen.

Google erweitert die App nun um eine völlig neue Ebene interaktiven Komforts für Nutzer. Bisher wurden in Gemini nur Bilder beschrieben. Beim Betrachten von Bildern können Nutzer nun sogar weitere Fragen dazu stellen und ein ausführlicheres Gespräch führen.

Wie hilft es Benutzern mit Sehschwierigkeiten?

„Wenn Ihnen ein Freund das nächste Mal ein Foto seiner neuen Gitarre schickt, können Sie eine Beschreibung erhalten und weitere Fragen zu Marke und Farbe oder sogar zu anderen Motiven auf dem Bild stellen“, so Google. Dies basiert auf dem verbesserten Bedienungskomfort, mit dem Gemini Ende letzten Jahres in das Talkback-System integriert wurde .

Das Talkback-Menü auf Android verfügt nun über eine spezielle Bildschirmbeschreibungsfunktion, die Gemini die Steuerung überlässt. Wenn Nutzer beispielsweise einen Bekleidungskatalog durchsuchen, beschreibt Gemini nicht nur, was auf dem Bildschirm erscheint, sondern beantwortet auch relevante Fragen.

Benutzer können beispielsweise Fragen stellen wie: „Welches Kleid passt am besten zu einem Ausflug an einem kalten Winterabend?“ oder „Welche Soße passt am besten zu einem Sandwich?“ Gemini kann außerdem den gesamten Bildschirm analysieren und Benutzer über detaillierte Produktdetails oder verfügbare Rabatte informieren.

Beschriftungen ausdrucksvoller gestalten und Textzoom verbessern

Im Chrome-Browser verbessert Google die automatisch generierten Untertitel für Videos ein wenig . Nehmen wir an, Sie schauen ein Fußballspiel. Die Untertitel folgen dann nicht mehr nur den Worten des Kommentators, sondern passen auch zu dessen Emotionen und Ausdrucksweise.

Beispielsweise wird Nutzern mit Hörproblemen anstelle von „Tor“ ein lautes „Tooaaal“ angezeigt, um die emotionale Betonung zu verstärken. Google nennt diese Untertitel „Expressive Captions“.

Neben der menschlichen Sprache werden nun auch wichtige Geräusche wie Pfiffe, Jubel oder auch das Räuspern des Sprechers abgedeckt. Ausdrucksstarke Untertitel werden auf allen Geräten mit Android 15 oder einer neueren Version in den USA, Großbritannien, Kanada und Australien verfügbar sein.

Eine weitere wichtige Neuerung im Chrome-Browser ist der adaptive Textzoom. Dabei handelt es sich im Wesentlichen um eine Aktualisierung des auf Android-Smartphones verfügbaren Page-Zoom-Systems. Wenn Benutzer nun die Textgröße vergrößern, hat dies keine Auswirkungen auf das Layout der restlichen Webseite.

„Sie können den Zoom individuell anpassen und diese Einstellung ganz einfach auf alle besuchten Seiten oder nur auf bestimmte anwenden“, so Google. Nutzer können den Zoombereich mithilfe eines Schiebereglers am unteren Seitenrand anpassen.