DoSSIER wird die unterschiedlichen Informationsbedürfnisse professioneller Nutzer*innen aufklären, modellieren & ansprechen
Das Research Studio Data Science entwickelt ein neues System für einen direkten Informationszugang, um das, was in der Wissensbasis professioneller Benutzer*innen fehlt, zu fokussieren und folglich direkt geeignete und wertvolle Informationen zu präsentieren.
Der Umgang mit Informationen, die von wissenschaftlich und technisch gebildeten Benutzer*innen benötigt werden, stellt für bestehende Information-Retrieval-Systeme oft eine Herausforderung dar. Eine dieser Herausforderungen ist darauf zurückzuführen, dass allgemein einsetzbare Information-Retrieval-Systeme das Wissen der Benutzer*innen in den Retrieval-Modellen nicht berücksichtigen und daher möglicherweise entweder offensichtliche oder zu spezialisierte Ressourcen anbieten.
Das Ziel von DoSSIER ist es, dieses Problem anzugehen, indem es den Stand der Technik in unserem Verständnis computergestützter menschlicher Informationssuch-Workflows vorantreibt. Das Ergebnis dieses Projekts wird eine neue Generation von Informationszugangssystemen sein, die die Innovationszyklen im akademischen und industriellen Bereich der EU beschleunigen wird. Weitere Informationen auf Dossier-Project.eu.
Ein exzellentes und hochgradig synergetisches Team von weltweit führenden Information Retrieval (IR)-Expert*innen aus 5 EU-Ländern erforscht zusammen mit 3 akademischen Partnern (Universitäten in den USA, Japan und Australien) und 11 Industriepartner grundlegende Erkenntnisse darüber, wie Benutzer*innen Informationen im beruflichen Umfeld verstehen, formulieren und erhalten.
Das Projekt 13 von DoSSIER (auch bekannt unter dem Code KD; d.h. Wissensdelta) zielt darauf ab, das Wissen verschiedener Nutzer*innen und die verfügbaren Dokumente zu modellieren und so das Problem der wissenschaftlichen Informationsbeschaffung zu lösen, indem für jede/n Nutzer*in die relevantesten Dokumente gefunden werden. Der Unterschied zwischen dem, was ein/e Benutzer*in weiß, und dem ihm/ihr fehlenden Wissen, das in den Dokumenten im Web vorhanden ist, wird als Wissensdelta definiert. Das Wissensdelta für jede/n Benutzer*in und jede Domäne ist spezifisch, weshalb KD zwei Hauptziele verfolgt:
1) Definition und Modell der textlichen Ähnlichkeit als Wissensunterschied
2) Klärung der Beziehung zwischen Informationsbedarf und sprachlichen Darstellungen
Yasin Ghafourian, ein neuer Forscher am Research Studio DSc, wurde ausgewählt, das Projekt KD unter der Aufsicht von Dr. Petr Knoth, Direktor des Research Studio DSc, und Prof. Allan Hanbury der Technischen Universität Wien durchzuführen:
„“Im Rahmen des Projekts KD werden wir sehen, dass eine neue formale Definition des Wissens eines Nutzers entwickelt wird, die auf der Verschmelzung von statistischer, latenter und expliziter Semantik basiert und auch die lang- und kurzfristigen Informationsinteressen der Nutzer einbezieht. Anschließend werden wir, nachdem wir ein Modell für das Wissen eines Benutzers erstellt haben, ein neuartiges Information-Retrieval-Modell initiieren, das nicht nur auf der Ähnlichkeit zwischen der sprachlichen Äußerung eines Informationsbedürfnisses und dem Inhalt indexierter Dokumente basiert, sondern auch und vor allem auf dem Unterschied zwischen dem Wissensmodell des Benutzers und dem der indexierten Sammlung, wodurch sichergestellt wird, dass jedem professionellen Benutzer nur die Informationen präsentiert werden können, die für ihn entsprechend seinem aktuellen Wissen und seinen Interessen am besten geeignet sind.„, Yasin Ghafourian über sein neues Projekt.
Mehr über Yasin Ghafourian
Yasin Ghafourian erhielt 2016 seinen Bachelor-Abschluss in Computer Software Engineering von der Universität Kharazmi in Teheran und 2019 seinen Master-Abschluss von der Universität Teheran im Iran. Er verfügt außerdem über ein Jahr Erfahrung als Daten-/Geschäftsanalyst für ein iranisches Online-Reisebüro. Im Rahmen seiner Forschung auf dem Gebiet der Informationswiedergewinnung hat er an der Verbesserung von Fragewiedergewinnungsalgorithmen im Zusammenhang mit Relevanzmodellen in gemeinschaftsbasierten Fragebeantwortungssystemen gearbeitet und dabei Erfahrungen in der Arbeit mit Relevanzmodellen, Erweiterungsalgorithmen, wortbasierten Modellen und künstlichen tiefen neuronalen Netzen gesammelt.