Przejdź do treści

Publikacje

Wartość? 200 punktów

Publikacje to nieodłączna część pracy naukowców. To publikacje opisują i podsumowują dorobek badawczy, często wielomiesięczny albo nawet wieloletni wysiłek, budują pozycję naukowców i całych zespołów. Są także elementem ewaluacji – oceny konkretów osób, a co za tym udzie – całych dyscyplin.

Na poniższej liście prezentujemy najwyżej punktowane publikacje (czyli takie za 200 punktów), w które wkład mieli naukowcy z Politechniki Warszawskiej. Wykaz obejmuje dane od początku 2023 roku.

Interpretable inverse iteration mean shift networks for clustering tasks

Artykuł wprowadza architekturę Mean Shift Network (MS-Net) - stanowiącą nowy model rozmytego grupowania. Weryfikacja eksperymentalna obejmująca 5 różnych zadań grupowania oraz 6 zbiorów danych rzeczywistych potwierdza efektywność zaproponowanego podejścia.

Artykuł:

Neural Networks

Rok wydania:

Autorzy z PW:

Jacek Mańdziuk

Cultivating Archipelago of Forests: Evolving Robust Decision Trees Through Island Coevolution

Drzewa decyzyjne są powszechnie stosowane w uczeniu maszynowym ze względu na swoją prostotę i łatwość interpretacji, jednak często brakuje im odporności na ataki adwersarialne i zakłócenia danych. W artykule zaproponowano nowy wyspowy algorytm koewolucyjny (ICoEvoRDF) do konstruowania odpornych zespołów drzew decyzyjnych. Algorytm działa na wielu wyspach, z których każda zawiera populacje drzew decyzyjnych oraz adwersarialnych zakłóceń. Populacje na każdej wyspie ewoluują niezależnie, przy czym okresowo migrują najlepiej działające drzewa decyzyjne między wyspami. Takie podejście sprzyja różnorodności i zwiększa eksplorację przestrzeni rozwiązań, prowadząc do tworzenia bardziej odpornych i dokładniejszych zespołów drzew decyzyjnych. ICoEvoRDF wykorzystuje popularną w teorii gier koncepcję mieszanej równowagi Nasha do ważenia elementów zespołu, co dodatkowo poprawia wyniki. Algorytm został oceniony na 20 zestawach danych referencyjnych, wykazując swoją przewagę nad najnowocześniejszymi metodami w optymalizacji zarówno dokładności w warunkach adwersarialnych, jak i minimalizacji metryki max regret. Elastyczność ICoEvoRDF pozwala na integrację drzew decyzyjnych z różnych istniejących metod, zapewniając ujednolicony sposób łączenia zróżnicowanych rozwiązań. Zaproponowane podejście stanowi obiecujący kierunek rozwoju odpornych i interpretowalnych modeli uczenia maszynowego.

Materiał konferencyjny:

Proceedings of the 39th Annual AAAI Conference on Artificial Intelligence, vol. 39, nr 1

Rok wydania:

Autorzy z PW:

Adam Żychowski

Advancing Generalization Across a Variety of Abstract Visual Reasoning Tasks

Proponujemy nowy model uczenia głębokiego PoNG (ang., “Pathways of Normalized Group Convolution”) do rozumowania z obrazów. Eksperymenty na progresywnych matrycach Ravena i problemach analogii wizualnych pokazują jego przewagę nad dotychczasowymi metodami, zwłaszcza w generalizacji do problemów z nowych rozkładów.

Materiał konferencyjny:

Proceedings of the Thirty-Fourth International Joint Conference on Artificial Intelligence (IJCAI-25)

Rok wydania:

Autorzy z PW:

Mikołaj Małkiński, Jacek Mańdziuk

Reasoning Limitations of Multimodal Large Language Models. A case study of Bongard Problems

Badamy, czy wielomodalne wielkie modele językowe (MLLM) potrafią rozwiązywać problemy Bongarda, testując różne strategie na trzech zbiorach danych. Wprowadzamy nowy zbiór Bongard-RWR, który przedstawia koncepty z klasycznych problemów Bongarda w formie obrazów ze świata rzeczywistego. Eksperymenty pokazują, że MLLM mają trudności z rozpoznawaniem abstrakcyjnych konceptów zarówno w problemach syntetycznych, jak i rzeczywistych.

Materiał konferencyjny:

Proceedings of Machine Learning Research

Rok wydania:

Autorzy z PW:

Mikołaj Małkiński, Jacek Mańdziuk

Interpreting CLIP with Hierarchical Sparse Autoencoders

Autokodery rzadkie (SAE) są przydatne do wykrywania i sterowania interpretowalnymi funkcjami w sieciach neuronowych, ze szczególnym potencjałem do zrozumienia złożonych reprezentacji multimodalnych. Biorąc pod uwagę ich zdolność do odkrywania interpretowalnych cech, SAE są szczególnie cenne w analizie modeli wizyjno-językowych (np. CLIP i SigLIP), które są podstawowymi elementami składowymi w nowoczesnych systemach na dużą skalę, ale pozostają trudne do interpretacji i kontroli. Jednak obecne metody SAE są ograniczone przez optymalizację zarówno jakości rekonstrukcji, jak i rzadkości jednocześnie, ponieważ opierają się na tłumieniu aktywacji lub sztywnych ograniczeniach rzadkości. W tym celu przedstawiamy Matryoshka SAE (MSAE), nową architekturę, która uczy się hierarchicznych reprezentacji na wielu ziarnistościach jednocześnie, umożliwiając bezpośrednią optymalizację obu wskaźników bez kompromisów. MSAE ustanawia najnowocześniejszą granicę Pareto między jakością rekonstrukcji a rzadkością dla CLIP, osiągając 0,99 podobieństwa cosinusowego i mniej niż 0,1 frakcji wariancji niewyjaśnionej przy zachowaniu 80% rzadkości. Na koniec demonstrujemy użyteczność MSAE jako narzędzia do interpretacji i kontrolowania CLIP poprzez wyodrębnienie ponad 120 pojęć semantycznych z jego reprezentacji w celu przeprowadzenia wyszukiwania podobieństwa opartego na pojęciach i analizy uprzedzeń w dalszych zadaniach, takich jak CelebA.

Materiał konferencyjny:

Proceedings of Machine Learning Research

Rok wydania:

Autorzy z PW:

Vladimir Zaigrajew, Przemysław Biecek

A-I-RAVEN and I-RAVEN-Mesh: Two New Benchmarks for Abstract Visual Reasoning

Badamy zdolność sieci neuronowych do generalizacji i transferu wiedzy w rozumowaniu z obrazów, korzystając z progresywnych matryc Ravena. Wprowadzamy dwa nowe zbiory danych do badania generalizacji (A-I-RAVEN) i transferu wiedzy (I-RAVEN-Mesh). Ewaluacja 13 modeli uczenia głębokiego wykazuje ich ograniczenia w rozważanych problemach.

Materiał konferencyjny:

Proceedings of the Thirty-Fourth International Joint Conference on Artificial Intelligence (IJCAI-25)

Rok wydania:

Autorzy z PW:

Mikołaj Małkiński, Jacek Mańdziuk

Arctic-TILT. Business Document Understanding at Sub-Billion Scale

Istotna część pracy którą deleguje się do Dużych Modeli Języka tyczy się odpowiadania na pytania związane z treścią dokumentu w formacie PDF bądź zeskanowanego. Wprowadzamy model Arctic-TILT, o którym wykazujemy, że osiąga jakość porównywalną z modelami 1000x większymi. Można do wystroić oraz zainstalować na pojedynczej karcie GPU 24Gi, minimalizując koszt operacyjny bez straty jakości, będąc w stanie procesować do 400k tokenów. Model osiąga wyniki klasy SOTA na siedmiu różnych zadaniach rozumienia dokumentów, a także gwarantuje wiarygodne skalowanie poziomu ufności i szybką inferencję, które są kluczowe dla procesowania plików w dużej skali bądź w środowiskach wymagających niskich opóźnień.

Materiał konferencyjny:

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 6: Industry Track)

Rok wydania:

Autorzy z PW:

Paweł Józiak

Rethinking Visual Counterfactual Explanations Through Region Constraint

Wizualne wyjaśnienia kontrfaktyczne (VCE) zyskały ostatnio ogromną popularność jako narzędzie do wyjaśniania procesu podejmowania decyzji przez klasyfikatory obrazów. Trend ten jest w dużej mierze motywowany tym, co te wyjaśnienia obiecują dostarczyć - wskazać semantycznie znaczące czynniki, które zmieniają decyzję klasyfikatora. Twierdzimy jednak, że obecne najnowocześniejsze podejścia nie zawierają kluczowego komponentu - ograniczenia regionu - którego brak uniemożliwia wyciągnięcie jednoznacznych wniosków, a nawet może prowadzić do błędnego rozumowania z powodu zjawisk takich jak błąd potwierdzenia. Aby rozwiązać problem poprzednich metod, które modyfikują obrazy w bardzo splątany i szeroko rozproszony sposób, proponujemy VCE z ograniczeniami regionalnymi (RVCE), które zakładają, że tylko wstępnie zdefiniowany region obrazu może zostać zmodyfikowany w celu wpłynięcia na przewidywania modelu. Aby efektywnie próbkować z tej podklasy VCE, proponujemy Region-Constrained Counterfactual Schrödinger Bridge (RCSB), adaptację wykonalnej podklasy mostów Schrödingera do problemu warunkowego inpaintingu, gdzie sygnał warunkujący pochodzi z interesującego klasyfikatora. Oprócz ustanowienia nowego state-of-the-art z dużym marginesem, rozszerzamy RCSB, aby umożliwić dokładne rozumowanie kontrfaktyczne, w którym predefiniowany region zawiera tylko interesujący czynnik, i włączając użytkownika do aktywnej interakcji z RVCE poprzez ręczne predefiniowanie regionów.

Materiał konferencyjny:

International Conference on Representation Learning 2025 (ICLR 2025)

Rok wydania:

Autorzy z PW:

Przemysław Biecek

SeFNet: Linking tabular datasets with semantic feature nets

Tabelaryczne zbiory danych odgrywają znaczącą rolę w szerokim zakresie aplikacji uczenia maszynowego. Jednakże, mimo że często dotyczą one podobnych problemów, tabelaryczne zbiory danych są zwykle traktowane jako samodzielne zadania. Możliwości wykorzystania wcześniej rozwiązanych problemów są ograniczone ze względu na brak ustrukturyzowanych informacji kontekstowych o ich cechach oraz brak zrozumienia zależności między nimi. Aby przezwyciężyć to ograniczenie, proponujemy nową metodologię o nazwie Semantic Feature Net (SeFNet), przechwytującą semantyczne znaczenie analizowanych cech tabelarycznych. Wykorzystując istniejące ontologie i wiedzę dziedzinową, SeFNet otwiera nowe możliwości dzielenia się spostrzeżeniami między różnymi zadaniami predykcyjnymi. Jedną z takich możliwości jest miara podobieństwa semantycznego opartego na ontologii zbioru danych (DOSS), która określa ilościowo podobieństwo między zbiorami danych przy użyciu relacji między ich cechami. W tym artykule przedstawiamy przykład zastosowania sieci SeFNet przygotowanej dla zbioru zadań predykcyjnych w opiece zdrowotnej, z relacjami cech pochodzącymi z ontologii SNOMED-CT. Proponowana metodologia SeFNet i towarzysząca jej miara DOSS rozwiązują problem ograniczonych informacji kontekstowych w tabelarycznych zbiorach danych. Włączając wiedzę dziedzinową i ustanawiając relacje semantyczne między cechami, zwiększamy potencjał meta-uczenia się i umożliwiamy dzielenie się cennymi spostrzeżeniami w różnych zadaniach predykcyjnych.

Artykuł:

Information Fusion

Rok wydania:

Autorzy z PW:

Katarzyna Woźnica, Przemysław Biecek

Experimental technique for evaluating ADC aperture jitter in the frequency domain

Wewnętrzna niepewność czasowa przetworników analogowo-cyfrowych (ADC), zwykle określana jako niepewność momentu próbkowania (ang. aperture jitter), jest najczęściej podawana przez producentów jako pojedyncza wartość liczbowa reprezentująca całkowitą skuteczną wartość RMS. W zastosowaniach wąskopasmowych istotna jest jednak jedynie część szumu fazowego, która wpływa na akwizycje analizowanych danych. W niniejszej pracy przedstawiono kompleksowe eksperymentalne podejście  do charakteryzowania szumu fazowego niepewności momentu próbkowania w dziedzinie częstotliwości. Wykorzystany układ pomiarowy opiera się na dwóch identycznych kanałach ADC, wykonujących pomiary w schemacie próbkowania non-IQ, co pozwala na oddzielne zidentyfikowanie szumu fazowego skorelowanego i nieskorelowanego. Zbadano również wpływ szumu dodawanego przez stopień wejściowy i uwzględniono go w proponowanej procedurze pomiarowej. Metodologię zastosowano do scharakteryzowania komercyjnego przetwornika analogowo-cyfrowego. Zmierzono szum biały na poziomie −147,71 dBc/Hz oraz szum migotania na poziomie −113,81 dBc/Hz. Zmierzona wartość niestabilności czasowej wejścia, scałkowana w pełnym zakresie pasma Nyquista, jest zgodna z wartością RMS podaną przez producenta.

Artykuł:

Measurement

Rok wydania:

Autorzy z PW:

Krzysztof Marek Czuba, Bartosz Gąsowski, Maciej Grzegrzółka

The Role of Lone Pairs in Fast Oxide Ion Conduction in Rhombohedral Bi0.8Pr0.2O1.5

Przewodnik jonów tlenkowych Bi₀,₈Pr₀,₂O₁,₅ wykazuje wyjątkową przewodność jonową, wynoszącą 0,8 S cm⁻¹ w temperaturze 800 °C, co wynika z warstwowej struktury romboedrycznej materiału oraz unikalnej interakcji między stereochemicznie aktywnymi parami elektronowymi bismutu a ruchliwymi jonami tlenkowymi. W niniejszej pracy łączymy analizę za pomocą metody Reverse Monte Carlo (RMC) danych uzyskanych z całkowitego rozpraszania neutronów z metodologią dynamiki molekularnej ab initio, aby wyjaśnić rolę par elektronowych Bi³⁺ 6s² w transporcie jonów podczas przejścia fazowego β₂ ↔ β₁. Wykazujemy, że przejście to charakteryzuje się przemieszczeniem jonów tlenkowych do przerwy van der Waalsa oraz równoczesną reorientacją jednostek BiO₄ na krawędziach bloków fluorytowych, co ułatwia zwiększoną ruchliwość jonów tlenkowych poprzez dodatkowe ścieżki przewodzenia. Wyniki te ustanawiają mechanistyczne powiązanie między stereochemią par elektronowych a transportem jonów w wysokich temperaturach, oferując nowe zasady projektowania zaawansowanych elektrolitów stałych opartych na ciężkich pierwiastkach grupy p.

Artykuł:

Chemistry of Materials

Rok wydania:

Autorzy z PW:

Jan Jamroz, Marcin Kryński, Marcin Małys, Franciszek Krok, Wojciech Wróbel

Dyscyplina:

Cesium Lead Chloride as an Artificial Solid Electrolyte Interphase for Enhanced Anode Protection in Lithium Metal Batteries

Metaliczny lit ma potencjał dalszego zwiększenia gęstości energetycznej akumulatorów litowych. Jednak jego niestabilność w konwencjonalnych elektrolitach ciekłych, prowadząca do niskiej sprawności kulombowskiej, ogranicza jego praktyczne zastosowania. Celem opisanych badań, było opracowanie prostej, taniej metody nakładania kroplowego (drop-casting) prowadzącej do utworzenia sztucznej warstwy SEI (solid electrolyte interphase) na powierzchni litu z wykorzystaniem chlorku cezu ołowiowego (CsPbCl₃). Ta nieorganiczna powłoka ochronna zwiększa stabilność granicy faz między anodą litową a elektrolitem ciekłym, skutecznie redukując typowe mechanizmy degradacji materiału elektrodowego. Badania przeprowadzone dla symetrycznych ogniw Li||Li z powłoką CsPbCl₃-Li wykazały ich stabilność cykliczną przez 600 godzin przy gęstości prądu 1 mA/cm² i pojemności 1 mAh/cm². W połączeniu z katodami LiFePO₄ (LFP) o masie 7,5 mg/cm², ogniwa CsPbCl₃-Li||LFP zachowały 99,46% pojemności przy prądzie 1C przez 250 cykli, przewyższając wydajnością ogniwa z niepowlekanymi anodami litowymi. Potwierdzono zatem, że zastosowanie technologii powlekania anod litowych cienkimi warstwami perowskitów stanowi obiecujące rozwiązanie dla stabilizacji metalicznego litu i umożliwia dalszy rozwój prac nad ładowalnymi akumulatorami z metalicznym litem o wysokiej gęstości energetycznej.

Artykuł:

Chemistry of Materials

Rok wydania:

Autorzy z PW:

Władysław Wieczorek, Janusz Lewiński

Dyscyplina: