Es gibt jetzt weitere Hinweise darauf, in welche Richtung die Bemühungen des iPhone-Herstellers gehen. Unter dem Titel "ReALM: Reference Resolution As Language Modeling" haben die Apple-Mitarbeiter eine KI entwickelt, die Nutzereingaben verstehen soll, die sich auf die aktuelle Bildschirmanzeige beziehen, aber etwa auch auf laufende Unterhaltungen. In einem der dargelegten Beispielszenarien wird das Gerät per Sprachassistent aufgefordert, eine Liste von Apotheken aufzuzeigen.

Im nächsten Schritt kann der Nutzer per Spracheingabe unter Andeutung der Position auf dem Bildschirm dann einfach einen Anruf tätigen, indem er "Rufe die in der XY-Straße an" sagt, sich auf die unterste auf dem Bildschirm bezieht oder einfach nur sagt "Rufe diese Nummer an", wenn nur eine auf dem Bildschirm angezeigt wird. Je nach Komplexität der angezeigten Informationen habe das mit einer nahezu vollständigen Genauigkeit funktioniert

