İçeriğe atla

İlgililik (bilgi erişimi)

Vikipedi, özgür ansiklopedi

Bilgi bilimi ve bilgi erişiminde ilgililik, alınan bir belgenin veya belge kümesinin kullanıcının bilgi ihtiyacını ne kadar iyi karşıladığını belirtir. İlgililik, zamanınlılık, otorite veya sonucun yeniliği gibi endişeleri içerebilir.

İlgili bilgiyi bulma sorununa ilişkin kaygı, en azından 17. yüzyılda bilimsel dergilerin ilk yayımlanmasına kadar uzanmaktadır.[1]

İlgililiğin resmi çalışması, 20. yüzyılda daha sonra bibliyometri olarak adlandırılacak olan şeyin incelenmesiyle başladı . 1930'larda ve 1940'larda SC Bradford , bir konuyla ilgili makaleleri tanımlamak için "ilgili" terimini kullandı (bkz. Bradford yasası ). 1950'lerde ilk bilgi alma sistemleri ortaya çıktı ve araştırmacılar, ilgisiz makalelerin alınmasını önemli bir endişe olarak kaydettiler. 1958'de BC Vickery, Uluslararası Bilimsel Bilgi Konferansı'ndaki bir konuşmasında ilgililik kavramını açıkça belirtti.[2]

1958'den bu yana, bilgi bilimciler ilgili olma kavramının tanımlarını araştırmış ve tartışmıştır. Bu tartışmanın odak noktalarından biri, "bir konuya olan ilgililik" ya da "konusal ilgililik" ile "kullanıcı ilgililiği" arasındaki ayrım olmuştur. [2]

Bilgi arama topluluğu , 1960'ların başındaki Cranfield Deneyleri ile başlayıp günümüzde bilgi arama araştırmaları için ana değerlendirme çerçevesi olarak devam eden TREC değerlendirmeleriyle sonuçlanan , konu ile ilgili alaka düzeyini ölçmek için test koleksiyonlarının ve kıyaslama görevlerinin kullanımını vurgulamıştır.[3]

Bir bilgi erişim sisteminin konu açısından alakalı sonuçları ne kadar iyi aldığını değerlendirmek için , alınan sonuçların alakalılığı niceliksel olarak belirlenmelidir. Cranfield tarzı değerlendirmelerde, bu genellikle alınan her sonuca bir alakalılık düzeyi atamayı içerir , bu da alakalılık değerlendirmesi olarak bilinen bir işlemdir . Alaka düzeyleri ikili (bir sonucun alakalı olduğunu veya alakalı olmadığını gösterir) veya dereceli (sonuçların, sonucun konusu ile bilgi ihtiyacı arasında değişen bir eşleşme derecesine sahip olduğunu gösterir) olabilir. Alınan sonuçlara alakalılık düzeyleri atandıktan sonra, bir alma sisteminin çıktısının kalitesini değerlendirmek için bilgi erişim performans ölçümleri kullanılabilir.

  • İlgililik ölçütleri
  • Sıra içermeyen ilgililik ölçüt metrikleri.
  1. Precision (Kesinlik) :Geri getirilen belgelerin ne kadarının ilgili olduğu.
  2. Recall (Duyarlılık) :İlgili belgelerin ne kadarının geri getirildiği.
  3. F1 Skoru :Precision ve Recall'un harmonik ortalaması.
  • Sıra içeren ilgililik ölçüt metrikleri
  1. Average Precision : bir sorgu içinde kesinliğin ortalaması.
  2. Mean Average Precision (MAP): çoklu sorgularının kesinliğin ortalaması.

Bu yalnızca topikal alaka düzeyine odaklanmanın aksine, bilgi bilimi topluluğu kullanıcı alaka düzeyini göz önünde bulunduran kullanıcı çalışmalarını vurgulamıştır.[4] Bu çalışmalar genellikle insan-bilgisayar etkileşiminin yönlerine odaklanmaktadır (ayrıca bkz. İnsan-bilgisayar bilgi alımı).

Kümeleme ve ilgililik

[değiştir | kaynağı değiştir]

1979 yılında C. J. van Rijsbergen tarafından ortaya atılan kümeleme hipotezi (cluster hypothesis), birbirine benzer iki belgenin, aynı bilgi ihtiyacına yönelik olarak ilgili olma olasılığının yüksek olduğunu öne sürer. Gömülü benzerlik uzayı açısından bakıldığında, bu hipotez genel ya da yerel olarak yorumlanabilir. Genel yorum, belgeler arası benzerlikten türetilen bazı sabit temel konular olduğunu varsayar. Bu genel kümeler veya temsilcileri daha sonra iki belgenin alaka düzeyini ilişkilendirmek için kullanılabilir (örneğin aynı kümedeki iki belge aynı istekle ilgili olmalıdır). Bu ruhtaki yöntemler

  • küme tabanlı bilgi alımı[5][6]
  • gizli semantik analizi veya dil modelleme eşdeğerleri gibi küme tabanlı belge genişlemesi.[7] Kümelerin - tecrit veya kombinasyon halinde - olası ilgili belgelerin kümesini başarıyla modellemesini sağlamak önemlidir.

Ellen Voorhees tarafından öne sürülen ikinci bir yorumlama  , belgeler arasındaki yerel ilişkilere odaklanır.[8] Yerel yorumlama, koleksiyondaki kümelerin sayısını veya boyutunu modellemekten kaçınır ve birden fazla ölçekte alaka düzeyine izin verir. Bu ruhtaki yöntemler şunları içerir:

  • Çoklu Küme Alma [6][8]
  • Yayılma aktivasyonu ve ilişki düzeyi yöntemler[9][10]
  • Yerel Belge Genişlemesi[11]
  • Skor düzenleme[12]

Yerel yöntemler doğru ve uygun bir belge benzerlik ölçümü gerektirir .

Sorunlar ve alternatifler

[değiştir | kaynağı değiştir]

En ilişkili belgeler, arama sonuçlarının ilk sayfasında görüntülenmesi en yararlı olanlar olmayabilir. Örneğin, iki yinelenen belge tek tek oldukça alakalı kabul edilebilir, ancak bunlardan yalnızca birini görüntülemek faydalıdır. Bu eksikliği yönetmek için "maksimum marjinal ilgililik" (MMR) adı verilen bir ölçü önerilmiştir. Her belgenin alakalılığını yalnızca önceki sonuçlar göz önüne alındığında ne kadar yeni bilgi getirdiği açısından değerlendirir.

Bazı durumlarda, bir sorgu belirsiz bir yoruma veya çeşitli olası yanıtlara sahip olabilir. Sonuç kümesinin faydasını değerlendirirken çeşitli sonuçlar sağlamak bir husus olabilir. [13]

  1. ^ Ülker, Mehmet; Terzioğlu, Emel; Şahin, Mehmet; Özbaysar, Mesut (1 Ekim 2019). "OKUL VE AİLE İŞ BİRLİĞİNDE YAŞANAN SORUNLAR VE ÇÖZÜM ÖNERİLERİ". NWSA Academic Journals. 14 (4): 124-131. doi:10.12739/nwsa.2019.14.4.1c0694. ISSN 1308-7231. 
  2. ^ a b Mizzaro, Stefano (Eylül 1997). "Relevance: The whole history". Journal of the American Society for Information Science (İngilizce). 48 (9): 810-832. doi:10.1002/(SICI)1097-4571(199709)48:9<810::AID-ASI6>3.0.CO;2-U. ISSN 0002-8231. 
  3. ^ Arni, Thomas; Clough, Paul; Sanderson, Mark; Grubinger, Michael (2009), Overview of the ImageCLEFphoto 2008 Photographic Retrieval Task, Springer Berlin Heidelberg, ss. 500-511, erişim tarihi: 14 Nisan 2025 
  4. ^ Xu, Yunjie (Calvin); Chen, Zhiwei (Mayıs 2006). "Relevance judgment: What do information users consider beyond topicality?". Journal of the American Society for Information Science and Technology (İngilizce). 57 (7): 961-973. doi:10.1002/asi.20361. ISSN 1532-2882. 4 Mart 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2025. 
  5. ^ Croft, W.Bruce (Ocak 1980). "A model of cluster searching based on classification". Information Systems (İngilizce). 5 (3): 189-195. doi:10.1016/0306-4379(80)90010-1. 29 Nisan 2025 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2025. 
  6. ^ a b Griffiths, Alan; Luckhurst, H. Claire; Willett, Peter (Ocak 1986). "Using interdocument similarity information in document retrieval systems". Journal of the American Society for Information Science (İngilizce). 37 (1): 3-11. doi:10.1002/(SICI)1097-4571(198601)37:1<3::AID-ASI1>3.0.CO;2-O. ISSN 0002-8231. 
  7. ^ Liu, Xiaoyong; Croft, W. Bruce (25 Temmuz 2004). "Cluster-based retrieval using language models". Proceedings of the 27th annual international ACM SIGIR conference on Research and development in information retrieval. New York, NY, USA: ACM: 186-193. doi:10.1145/1008992.1009026. 
  8. ^ a b Voorhees, Ellen M. (1985). "The cluster hypothesis revisited". Proceedings of the 8th annual international ACM SIGIR conference on Research and development in information retrieval - SIGIR '85. New York, New York, USA: ACM Press: 188-196. doi:10.1145/253495.253524. 
  9. ^ Kwiat, Paul; Chitambar, Eric; Conrad, Andrew; Isaac, Samantha (Eylül 2022). "Autonomous Vehicle-Based Quantum Communication Network". 
  10. ^ Qin, Tao; Liu, Tie-Yan; Zhang, Xu-Dong; Chen, Zheng; Ma, Wei-Ying (15 Ağustos 2005). "A study of relevance propagation for web search". Proceedings of the 28th annual international ACM SIGIR conference on Research and development in information retrieval. New York, NY, USA: ACM: 408-415. doi:10.1145/1076034.1076105. 
  11. ^ Singhal, Amit; Pereira, Fernando (Ağustos 1999). "Document expansion for speech retrieval". Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval. New York, NY, USA: ACM: 34-41. doi:10.1145/312624.312645. 
  12. ^ Qin, Tao; Liu, Tie-Yan; Zhang, Xu-Dong; Chen, Zheng; Ma, Wei-Ying (15 Ağustos 2005). "A study of relevance propagation for web search" (İngilizce). ACM: 408-415. doi:10.1145/1076034.1076105. ISBN 978-1-59593-034-7. 20 Şubat 2025 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2025. 
  13. ^ Carbonell, Jaime; Goldstein, Jade (Ağustos 1998). "The use of MMR, diversity-based reranking for reordering documents and producing summaries" (İngilizce). ACM: 335-336. doi:10.1145/290941.291025. ISBN 978-1-58113-015-7. 12 Mayıs 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2025.