Sztuczna inteligencja Microsoftu opisuje zdjęcia lepiej niż ludzie

Sztuczna inteligencja Microsoftu opisuje zdjęcia lepiej niż ludzie

Autor: Krzysztof Sulikowski

Opublikowano: 10/15/2020, 9:03 PM

Liczba odsłon: 2692

Microsoft ogłosił dostępność opartej na AI technologii do podpisywania obrazów w ramach usług Azure Cognitive Services. Gigant twierdzi, że system może teraz opisywać obrazy tak dobrze, jak robią to ludzie, a na pewno lepiej, niż było to do tej pory możliwe. W jaki sposób Microsoft zamierza z tego korzystać i co usługa ma do zaoferowania użytkownikom Microsoft Office?

Dorównanie człowiekowi to ważny kamień milowy każdego systemu — czy to zamieniającego mowę na tekst, tłumaczącego, czy rozpoznającego zawartość obrazów. Jego osiągnięcie oznacza, że usługa będzie mogła rzeczywiście pomóc deweloperom w podniesieniu dostępności ich aplikacji. Dzięki podpisom obrazów opartym na sztucznej inteligencji użytkownicy mogą dowiedzieć się, co dokładnie znajduje się na zdjęciach, np. w wynikach wyszukiwania czy w prezentacji. Gigant zastrzega jednak, że wyniki mogą nie zawsze być idealne.

Generowane automatycznie opisy zdjęć mogą również pomóc osobom niewidomym i niepełnosprawnym wzrokowo. Wielu autorów stron internetowych pamięta, aby zamieścić podpis zdjęcia w znaczniku "alt", jednak zazwyczaj jest on bardzo ogólnikowy i niewiele mówiący o prawdziwej zawartości.

Byłoby idealnie, gdyby każdy umieścił tekst alternatywny dla wszystkich obrazów w dokumentach, w Internecie, w mediach społecznościowych — ponieważ umożliwia to osobom niewidomym dostęp do treści i uczestniczenie w konwersacji. Ale niestety ludzie tego nie robią. Istnieje więc kilka aplikacji, które używają podpisów do obrazów jako sposobu na wypełnienie tekstu alternatywnego, gdy go brakuje.
— Saqib Shaikh, Software Engineering Manager / Project Lead w Seeing AI, Microsoft

Microsoft twierdzi również, że nowy system jest dwa razy lepszy niż model, który jest w użyciu od 2015 r. Co więcej, potrafi on wygenerować podpisy, które są bardziej opisowe i dokładne niż te napisane przez prawdziwych ludzi odnośnie do tych samych obrazów. Co ciekawe, z tego samego systemu korzysta również aplikacja Seeing AI.

Jeszcze w tym roku technologia generowania podpisów ma zostać włączona do programów Word i Outlook dla systemów Windows i Mac, a także do PowerPoint dla Windows i Mac oraz na przeglądarki. Wówczas sami będziemy mogli się przekonać, jak system działa w porównaniu z konkurencyjnymi modelami sztucznej inteligencji.

Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży
Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży

Wydarzenia