Microsoft i Amazon zaprezentowali dziś nowy interfejs deep learningowy o nazwie Gluon. Firmy z Seattle połączyły siły, aby uczynić deep learning bardziej dostępnym dla deweloperów i wyjść poza ograniczenia dzisiejszych modeli treningowych. Biblioteka dostarczyć ma "zwięzły i łatwy do zrozumienia" interfejs programistyczny, który pozwoli deweloperom tworzyć modele machine learningowe do wykorzystania w chmurze, na smartfonach i nie tylko.
Deweloperzy budujący sieci neuronowe używają trzech komponentów: danych treningowych, modelu i algorytmu. Algorytm trenuje model, by rozumiał wzory i zależności w danych. Ponieważ rozmiary tych danych są zwykle ogromne, a modele i algorytmy złożone, proces treningu trwa zwykle kilka dni lub tygodni. Silniki deep learningowe, takie jak Apache MXNet, Microsoft Cognitive Toolkit czy TensorFlow pomagają zwykle zoptymalizować szybkość treningu, jednak wymagają od deweloperów zdefiniowania modeli i algorytmów przy użyciu długiego, skomplikowanego i trudnego do zmiany kodu. Istnieją też inne narzędzia deep learningowe, które ułatwiają tworzenie modeli, jednak ich prostota może negatywnie wpływać na wydajność treningu. Okazuje się, że zalety obu tych scenariuszy można połączyć.
Gluon oferuje programistom API Pythona, które można używać do prototypowania, budowania i trenowania złożonych modeli machine learningowych. Microsoft i Amazon we wspólnym oświadczeniu dla prasy podkreślili, że budowanie modeli machine learningowych może być bardzo trudne, czasochłonne i zasobożerne. Gluon ma na celu rozwiązanie tych problemów przy pomocy API Pythona i gotowych komponentów sieci neuronowych. Gluon współpracuje już z Apache MXNet, ale jego twórcy zamierzają dodać jeszcze wsparcie dla Microsoft Cognitive Toolkit. "Stworzyliśmy interfejs Gluon, dzięki któremu budowanie sieci neuronowych i modeli treningowych może być tak proste, jak tworzenie aplikacji. Nie możemy się doczekać dalszej współpracy z Microsoft w zakresie dalszej ewolucji interfejsu Gluon dla programistów zainteresowanych łatwiejszą obsługą machine learnignu" - mówi Swami Sivasubramanian, VP z Amazon AI.
Korzystając z gotowego zestawu narzędzi dostarczonego przez Gluon, deweloperzy nie muszą pisać tysięcy linijek kodu, które potrzebne są do budowy i wytrenowania uczących się modeli. Co istotne, Gluon nie będzie miał żadnego wpływu na wydajność procesów trenowania - odbywają się one z taką samą szybkością, jak podczas bezpośredniego korzystania z silników pokroju Apache MXNet. Gluon jest już dostępny i można go znaleźć w serwisie GitHub.