Sukces Synerise w KDD Cup 2021

Polska firma zajęła trzecie miejsce, za Baidu i Deep Mind, w najważniejszym na świecie konkursie poświęconym sztucznej inteligencji i nauczaniu maszynowemu

Konkurs KDD Cup (International Knowledge Discovery and Data Mining Competition) odbył się w czasie konferencji KDD organizowanej przez ACM (American Computer Association) i nieoficjalnie jest nazywany Mistrzostwami Świata w dziedzinie AI. Odbywająca się od 1989 r. konferencja KDD jest najstarszym i największym na świecie wydarzeniem poświęconym eksploracji danych. Innowacje takie jak crowdsourcing, zakrojone na szeroką skalę konkursy data science, algorytmy personalizowania reklam (np. Google), eksploracji danych (np. Facebook, LinkedIn) oraz systemy rekomendacji (np. Netflix, Amazon itp.) w dużej części pochodzą właśnie z KDD.

W 2020 roku konferencja przyciągnęła ponad 3 900 badaczy zarówno ze świata komercyjnego jak i uniwersyteckiego. Uczestnicy KDD pochodzą z największych firm technologicznych na świecie, takich jak Google, Alibaba, Facebook, Netflix, LinkedIn, Tencent, Microsoft, IBM, Spotify czy Amazon. Równie ważny dla społeczności KDD jest głos instytucji państwowych takich jak NIH, NSF, DARPA i przedstawicieli tych branż można także spotkać w trakcie konferencji.

W tym roku niemal 2 500 zespołów z całego świata rywalizowało w trzech kategoriach konkursowych KDD Cup, z których nagrodzono trzech zwycięzców danej kategorii. Synerise wystąpił w najtrudniejszej z nich, organizowanej między innymi przez Uniwersytet Stanford, Facebook AI, Google i Intel.

Swoją pracą chcemy udowodnić, że nasz zespół AI może rywalizować z liderami innowacji z całego świata. Stworzyliśmy jeden z najdokładniejszych i najszybszych systemów – czas przetworzenia zbioru testowego za pomocą modelu Synerise wynosi około 7 minut, podczas gdy rozwiązanie Google DeepMind potrzebuje aż 12 godzin”, powiedział Michał Daniluk, AI Research Scientist w Synerise.

Zadanie konkursowe polegało na przewidywaniu tematyki publikacji naukowych na podstawie krawędzi zawartych w heterogenicznym grafie opracowań, cytowań, autorów i instytucji naukowych. Graf o bezprecedensowych rozmiarach (około 250 GB) zawierał ponad 244 mld wierzchołków trzec typów, połączonych aż 1,7 mld krawędziami, co pozwoliło na weryfikację algorytmów pod kątem gotowości do działania na danych o bardzo dużej skali.

Wielkie heterogeniczne grafy pojawiają się w wielu zastosowaniach praktycznych. Przetwarzany przez nas w ramach KDD Cup graf dotyczy cytowań akademickich, jednak dane o podobnej strukturze są obecne również w e-commerce (grafy transakcji klientów), wielkich bazach wiedzy i bazach dokumentów. Mistrzostwo w przetwarzaniu danych tego typu prowadzi więc do uzyskania konkretnej przewagi biznesowej w ulepszaniu jakości rekomendacji i wyszukiwania danych. Cieszy mnie, że dane dotyczące tego typu praktycznych problemów coraz częściej pojawiają się w ramach konkursów na czołowych konferencjach”, powiedziała Barbara Rychalska, AI Research Scientist w Synerise.

Polska ekipa w składzie Jacek Dąbrowski, Michał Daniluk, Barbara Rychalska oraz Konrad Gołuchowski w przeciwieństwie do większości drużyn, które usprawniły istniejące dotychczas algorytmy, zastosowała autorskie metody uczenia maszynowego: Cleora oraz EMDE. Metody opracowane przez zespół Synerise pozwoliły wcześniej na zwycięstwa w konkursach SIGIR Rakuten Data Challenge 2020 oraz WSDM Booking.com Data Challenge 2021. Stanowią one także kluczowy element systemu personalizacji dostępnego dla klientów Synerise. Rozwiązanie polskiego teamu zostało już opublikowane na stronach Uniwersytetu Stanforda.

W rywalizacji wzięli udział przedstawiciele najbardziej zaawansowanych technologicznie firm i uniwersytetów na świecie. Polski Synerise pokonał drużyny z całego świata, m.in. specjalistów firmy Intel (producenta procesorów komputerowych), OPPO Research Topology Lab (producenta telefonów OnePlus i Oppo) czy Huazhong University of Science and Technology.

W Synerise stawiamy na fundamentalne zrozumienie fenomenów matematycznych, leżących u podstaw działania deep learningu. W połączeniu z finezją inżynierii pozwala nam to konkurować z najlepszymi ośrodkami badawczymi na świecie, mimo że dysponujemy tylko ułamkiem dostępnych im zasobów”, powiedział Jacek Dąbrowski z Synerise.

Firma ma w swojej ofercie platformę Big Data i AI pozwalającą w oparciu o najnowsze rozwiązania technologiczne przetwarzać dane w czasie rzeczywistym z różnych źródeł w oparciu o autorskie systemy bazodanowe, własne algorytmy sztucznej inteligencji a także metody zautomatyzowanej egzekucji scenariuszy biznesowych dla segmentów takich jak retail, banking, telekomunikacja czy e-commerce. Wśród klientów Synerise znajdują się między innymi: CCC, Carrefour, Żabka, Orange, mBank, SharafDG.

 

We use cookies to personalise content and to analyse our traffic. We also share information about your use of our site with our analytics partners. View more
Cookies settings
Accept
Privacy & Cookie policy
Privacy & Cookies policy
Cookie name Active

PoLAND of IT masters: Information Hub

Privacy Policy

Address of our website is: hub.landofitmasters.pl

What data do we collect?

Our Company collects the following data:
  • A unique ID is used to generate statistical data on how the visitor uses the website.
  • Determining the preferred language of the visitor and setting the language accordingly on the website, if possible.
  • Used by Google Analytics to collect data on the number of times a user has visited the website as well as dates for the first and most recent visit.
  • Cookie used by Google Analytics to throttle request rate
How do we collect your data?
Our website collects the data about your preferred language with the use of a built-in widget and statistical data with the use of third-party provider Google Analytics.

How will we use your data?

Our Company collects your data so that we can improve the page's content and performance in future development.

What are your data protection rights?

Our Company would like to make sure you are fully aware of all of your data protection rights. Every user is entitled to the following: The right to access – You have the right to request Our Company for copies of your personal data. We may charge you a small fee for this service. The right to rectification – You have the right to request that Our Company correct any information you believe is inaccurate. You also have the right to request Our Company to complete the information you believe is incomplete. The right to erasure – You have the right to request that Our Company erase your personal data, under certain conditions. The right to restrict processing – You have the right to request that Our Company restrict the processing of your personal data, under certain conditions. The right to object to processing – You have the right to object to Our Company’s processing of your personal data, under certain conditions. The right to data portability – You have the right to request that Our Company transfer the data that we have collected to another organization, or directly to you, under certain conditions. If you make a request, we have one month to respond to you. If you would like to exercise any of these rights, please contact us. You can find our detailed contact information in the footer of this website or by following the contact link in the main menu.

Cookies

Cookies are text files placed on your computer to collect standard Internet log information and visitor behavior information. When you visit our websites, we may collect information from you automatically through cookies or similar technology For further information, visit allaboutcookies.org.

How do we use cookies?

Our Company uses cookies in a range of ways to improve your experience on our website, including:
  • Understanding how you use our website
  • Collecting information about your preferred language

What types of cookies do we use?

There are a number of different types of cookies, however, our website uses:
  • Functionality – Our Company uses these cookies so that we recognize you on our website and remember your previously selected preferences. These could include what language you prefer and location you are in. A mix of first-party and third-party cookies are used.

How to manage cookies

You can set your browser not to accept cookies, and the above website tells you how to remove cookies from your browser. However, in a few cases, some of our website features may not function as a result.

Privacy policies of other websites

The PoLAND of IT masters: Information hub website contains links to other websites. Our privacy policy applies only to our website, so if you click on a link to another website, you should read their privacy policy.

Changes to our privacy policy

Our Company keeps its privacy policy under regular review and places any updates on this web page. This privacy policy was last updated on 21 November 2021. If you make a request, we have one month to respond to you. You can find our detailed and up-to-date contact information in the footer of this website or by following the contact link in the main menu.  
Save settings
Cookies settings