Sztuczna inteligencja Microsoftu opisuje zdjęcia lepiej niż ludzie

Sztuczna inteligencja Microsoftu opisuje zdjęcia lepiej niż ludzie

 Krzysztof Sulikowski
Krzysztof Sulikowski
21:03
15.10.2020
1094 wyświetlenia

Microsoft ogłosił dostępność opartej na AI technologii do podpisywania obrazów w ramach usług Azure Cognitive Services. Gigant twierdzi, że system może teraz opisywać obrazy tak dobrze, jak robią to ludzie, a na pewno lepiej, niż było to do tej pory możliwe. W jaki sposób Microsoft zamierza z tego korzystać i co usługa ma do zaoferowania użytkownikom Microsoft Office?

Dorównanie człowiekowi to ważny kamień milowy każdego systemu — czy to zamieniającego mowę na tekst, tłumaczącego, czy rozpoznającego zawartość obrazów. Jego osiągnięcie oznacza, że usługa będzie mogła rzeczywiście pomóc deweloperom w podniesieniu dostępności ich aplikacji. Dzięki podpisom obrazów opartym na sztucznej inteligencji użytkownicy mogą dowiedzieć się, co dokładnie znajduje się na zdjęciach, np. w wynikach wyszukiwania czy w prezentacji. Gigant zastrzega jednak, że wyniki mogą nie zawsze być idealne.

Generowane automatycznie opisy zdjęć mogą również pomóc osobom niewidomym i niepełnosprawnym wzrokowo. Wielu autorów stron internetowych pamięta, aby zamieścić podpis zdjęcia w znaczniku "alt", jednak zazwyczaj jest on bardzo ogólnikowy i niewiele mówiący o prawdziwej zawartości.

Byłoby idealnie, gdyby każdy umieścił tekst alternatywny dla wszystkich obrazów w dokumentach, w Internecie, w mediach społecznościowych — ponieważ umożliwia to osobom niewidomym dostęp do treści i uczestniczenie w konwersacji. Ale niestety ludzie tego nie robią. Istnieje więc kilka aplikacji, które używają podpisów do obrazów jako sposobu na wypełnienie tekstu alternatywnego, gdy go brakuje.
— Saqib Shaikh, Software Engineering Manager / Project Lead w Seeing AI, Microsoft

Microsoft twierdzi również, że nowy system jest dwa razy lepszy niż model, który jest w użyciu od 2015 r. Co więcej, potrafi on wygenerować podpisy, które są bardziej opisowe i dokładne niż te napisane przez prawdziwych ludzi odnośnie do tych samych obrazów. Co ciekawe, z tego samego systemu korzysta również aplikacja Seeing AI.

Jeszcze w tym roku technologia generowania podpisów ma zostać włączona do programów Word i Outlook dla systemów Windows i Mac, a także do PowerPoint dla Windows i Mac oraz na przeglądarki. Wówczas sami będziemy mogli się przekonać, jak system działa w porównaniu z konkurencyjnymi modelami sztucznej inteligencji.


Spodobał Ci się ten artykuł? Podziel się z innymi!

Źródło: https://blogs.microsoft.com/ai/azure-image-captioning/

Polecamy również w kategorii Sztuczna inteligencja