
Content-Based Mining of Query Replacements
Dieses Buch stellt das Problem der inhaltsbasierten Abfrageersetzung vor.
Es motiviert die Begriffskorrelation, die mit MRFs modelliert wird, und die auf Stichproben basierende Technik, um die Definitionen der Suchphrasen zu lernen. Diese Definitionen werden als alternative Abfragen verwendet, um eine höhere Genauigkeit bei verschiedenen Retrievalaufgaben zu erreichen.
Die Suche nach relevanten Dokumenten bei gleichzeitiger Eliminierung irrelevanter Dokumente für die Anfrage eines Benutzers ist eine anspruchsvolle Aufgabe, die ein gutes Verständnis der Beziehung zwischen den Daten und der Anfrage sowie die Entwicklung von Algorithmen erfordert, die die Relevanz der Daten für die Anfrage effizient messen können. Im Rahmen dieser Dissertation haben wir eine Hypothese entwickelt, die das Problem des Minings von Suchphrasendefinitionen erheblich reduziert, indem wir die gemeinsame Verteilung von Begriffen als Produkt von bedingten Verteilungen modellieren, die als Markov Random Field modelliert werden. Wir gehen davon aus, dass es eine zugrunde liegende gemeinsame Verteilung zwischen den Begriffen gibt, die zur Beschreibung der Suchphrase verwendet werden.
Die von uns vorgeschlagene Modellierung ist eine komprimierte Darstellung der Beziehungen zwischen den Begriffen und scheint statistische Erkenntnisse zwischen den Begriffen zu erfassen. beschreibt eine Zielphrase.