Konu indeksleme
Bu madde, öksüz maddedir; zira herhangi bir maddeden bu maddeye verilmiş bir bağlantı yoktur. (Mayıs 2025) |
Konu indeksleme, farklı belgelerin ne hakkında olduğunu belirtmek , içeriklerini özetlemek veya bulunabilirliğini artırmak için bir belgeyi indeks terimleri , anahtar sözcükler veya diğer sembollerle tanımlama veya sınıflandırma eylemidir . Başka bir deyişle, belgelerin konusunu tanımlamak ve tanımlamakla ilgilidir . Dizinler, üç ayrı düzeyde ayrı ayrı oluşturulur: bir kitap gibi bir belgedeki terimler; bir kütüphane gibi bir koleksiyondaki nesneler; ve bir bilgi alanındaki belgeler (kitaplar ve makaleler gibi).
Konu indeksleme, özellikle belirli bir konu hakkındaki belgeleri almak için bibliyografik indeksler oluşturmak amacıyla bilgi almada kullanılır . Akademik indeksleme hizmetlerine örnek olarak Zentralblatt MATH, Chemical Abstracts ve PubMed verilebilir . İndeks terimleri çoğunlukla uzmanlar tarafından atanmıştır ancak yazar anahtar sözcükleri de yaygındır.
Dizinleme süreci, belgenin konusunun herhangi bir analiziyle başlar. Dizinleyici daha sonra, doğrudan belgeden sözcükler çıkararak veya kontrollü bir sözlükten sözcükler atayarak konuyu uygun şekilde tanımlayan terimleri belirlemelidir . [1] Dizin içindeki terimler daha sonra sistematik bir sırayla sunulur.
Dizinleyiciler, kaç terim ekleneceğine ve terimlerin ne kadar spesifik olması gerektiğine karar vermelidir. Bu birlikte, dizinlemenin derinliğini verir.
Konu indeksleme, belgelerin konusunu tanımlamak için kullanılan işlemdir. Konu indeksleme, belgenin ne hakkında olduğunu temsil eden terimler atamayı içerir.
Konu dizinleme, dizin dosyasının oluşturulması ve bakımında önemli bir işlemdir, çünkü bilginin alınması büyük ölçüde dizinlemenin kalitesine bağlıdır. Konu dizinleme süreci temel olarak üç adımdan oluşur.:
Tanıştırma => Analiz => Temsil
Başarılı bir dizine giden ilk adım aşinalıktır. Dizinleyici, belgenin konu içeriğine aşina olmalıdır. Konu içeriğini belirlemenin en güvenilir yolu, çalışmayı ayrıntılı olarak okumak veya incelemektir. Belgenin konu içeriğini belirlemek için her zaman başlığın ötesine bakmak akıllıca olacaktır, örn. içerik tablosu, bölüm başlıkları, önsöz, giriş, bölüm ve paragrafların açılış aşamaları, kitap kılıfı, vb. Referans kaynaklarına da danışılabilir ve ara sıra, özellikle konu dizinleyici için yabancı olduğunda, konu uzmanlarına danışılması gerekebilir.
Konu analizi, dizin terimlerinin seçiminden önceki ikinci adımdır. Belgeyi inceledikten sonra, dizinleyicinin içeriğini en iyi şekilde ifade eden kavramları seçmede mantıksal bir yaklaşım izlemesi gerekir. Bazen, dizinleyicilere kavramların tutarlı bir şekilde tanımlanması konusunda talimat verme yönünde aynı şekilde ilerleyebilecek yönergeler sağlanır.
Belgenin konu analizi tamamlandıktan sonra, son adım seçilen kavramları dizinleme sisteminin dilinde (dizin girişleri olarak) temsil etmektir. Dizinleyici, kavramların kullanılabilir ve erişilebilir bir biçimde düzenlenmesini sağlamak için dizinleme araçlarına ve bunların çalışma kurallarına ve prosedürlerine aşina olmalıdır.
Konu analizi
[değiştir | kaynağı değiştir]Dizinlemedeki ilk adım, belgenin konusuna karar vermektir. Manuel dizinlemede, dizinleyici konuyu "Belge belirli bir ürün, durum veya olguyla mı ilgili?" gibi bir dizi soruya verilen yanıt açısından ele alır. [2] Analiz, dizinleyicinin bilgi ve deneyiminden etkilendiğinden, iki dizinleyicinin içeriği farklı şekilde analiz edebileceği ve dolayısıyla farklı dizin terimleri üretebileceği sonucu çıkar. Bu, geri alma işleminin başarısını etkileyecektir.
Otomatik ve manuel konu analizi
[değiştir | kaynağı değiştir]Otomatik dizinleme, kelime kalıplarının frekanslarını analiz etme ve sonuçları konu kategorilerine atamak için diğer belgelerle karşılaştırma süreçlerini izler. Bunun için dizine eklenen materyalin anlaşılması gerekmez. Bu, daha tekdüze bir dizinlemeye yol açar ancak yorumlanan gerçek anlam pahasına. Bir bilgisayar programı ifadelerin anlamını anlamayacaktır ve bu nedenle bazı ilgili terimleri atamada başarısız olabilir veya yanlış atayabilir. İnsan dizinleyiciler, tam metni derinlemesine analiz etmek maliyetli ve zaman alıcı olduğundan, dikkatlerini başlık, özet, özet ve sonuçlar gibi belgenin belirli bölümlerine odaklar. [1] Otomatik bir sistem zaman sınırını ortadan kaldırır ve tüm belgenin analiz edilmesine izin verir, ancak aynı zamanda belgenin belirli bölümlerine yönlendirilme seçeneğine de sahiptir.
Terim seçimi
[değiştir | kaynağı değiştir]Dizinlemenin ikinci aşaması, konu analizinin bir dizi dizin terimine çevrilmesini içerir . Bu, belgeden çıkarmayı veya kontrollü bir sözlükten atamayı içerebilir. Tam metin araması yapma yeteneği yaygın olarak mevcut olduğundan, birçok kişi bilgi aramaları yapmada kendi uzmanlıklarına güvenmeye başladı ve tam metin araması çok popüler hale geldi. Konu dizinleme ve uzmanları, profesyonel dizinleyiciler, kataloglayıcılar ve kütüphaneciler, bilgi organizasyonu ve alımı için çok önemli olmaya devam ediyor. Bu uzmanlar kontrollü sözlükleri anlar ve tam metin aramasıyla bulunamayan bilgileri bulabilirler. Konu dizinlemesi oluşturmak için uzman analizinin maliyeti, karşılaştırılabilir bir tam metin, tamamen aranabilir materyaller kümesi üretmek için donanım, yazılım ve emek maliyetiyle kolayca karşılaştırılamaz. Her kullanıcının belgeleri açıklama yapmasına izin veren yeni web uygulamalarıyla, sosyal etiketleme özellikle Web'de popülerlik kazandı.[3]
Dizinlemenin bir uygulaması olan kitap dizini, bilgi devrimine rağmen nispeten değişmeden kalmıştır .
Çıkarım/Türev indeksleme
[değiştir | kaynağı değiştir]Çıkarım dizinlemesi, sözcükleri doğrudan belgeden almayı içerir. Doğal dil kullanır ve sözcük sıklıklarının hesaplandığı ve önceden belirlenmiş bir eşiğin üzerinde bir sıklığa sahip olanların dizin terimleri olarak kullanıldığı otomatik tekniklere iyi uyum sağlar. Yaygın sözcükleri ("the", "and" gibi) içeren bir durdurma listesi referans alınır ve bu durdurma sözcükleri dizin terimleri olarak hariç tutulur.
Otomatik çıkarma dizinlemesi, ifadelerin aksine tek kelimeleri dizinleyerek terimlerin anlam kaybına yol açabilir. Yaygın olarak görülen ifadeleri çıkarmak mümkün olsa da, anahtar kavramlar ifadelerde tutarsız bir şekilde ifade edilirse bu daha zor hale gelir. Otomatik çıkarma dizinlemesinin ayrıca, yaygın kelimeleri kaldırmak için bir durdurma listesi kullanılsa bile, bazı sık kullanılan kelimelerin belgeler arasında ayrım yapmaya olanak sağlamak için yararlı olmayabileceği sorunu vardır. Örneğin, glikoz terimi diyabetle ilgili herhangi bir belgede sıklıkla geçer. Bu nedenle, bu terimin kullanılması muhtemelen veritabanındaki belgelerin çoğunu veya tamamını döndürecektir. Terimlerin arama sırasında birleştirildiği sonradan koordineli dizinleme bu etkiyi azaltacaktır ancak uygun terimleri birbirine bağlama sorumluluğu bilgi uzmanına değil, arayan kişiye ait olacaktır. Ayrıca, nadiren görülen terimler oldukça önemli olabilir, örneğin yeni bir ilaç nadiren belirtilebilir ancak konunun yeniliği herhangi bir referansı önemli kılar. Daha nadir terimlerin dahil edilmesine ve yaygın sözcüklerin otomatik tekniklerle hariç tutulmasına izin vermenin bir yöntemi, bir belgedeki bir sözcüğün sıklığının, veritabanının tamamındaki sıklık ile karşılaştırıldığı bir göreli sıklık yaklaşımı olacaktır. Bu nedenle, veritabanının geri kalanına göre beklenenden daha sık bir belgede geçen bir terim daha sonra bir dizin terimi olarak kullanılabilir ve her yerde eşit sıklıkta geçen terimler hariç tutulur.
Otomatik çıkarmayla ilgili bir diğer sorun, bir kavramın tartışıldığı ancak metinde indekslenebilir bir anahtar sözcükle tanımlanmadığı zaman bunu tanımamasıdır.[4]
Bu süreç basit dizge eşleştirmeye dayandığından ve hiçbir entelektüel analiz içermediğinden, ortaya çıkan ürünün bir dizinden çok bir uyum olarak adlandırılması daha uygundur.
Görev dizinleme
[değiştir | kaynağı değiştir]Bir alternatif, dizin terimlerinin kontrollü bir sözlükten alındığı atama dizinlemesidir. Bu, tercih edilen terim dizinlendiği ve eşanlamlılar veya ilgili terimler kullanıcıyı tercih edilen terime yönlendirdiği için eşanlamlıları kontrol etme avantajına sahiptir . Bu, kullanıcının yazar tarafından kullanılan belirli terimden bağımsız olarak makaleler bulabileceği ve kullanıcının tüm olası eşanlamlıları bilmesi ve kontrol etmesi gerekmediği anlamına gelir. [5]Ayrıca, niteleyici bir terimin dahil edilmesiyle eşsesli sözcüklerden kaynaklanan herhangi bir karışıklığı da ortadan kaldırır . Üçüncü bir avantaj, hiyerarşi veya ilişkiyle bağlantılı olsunlar, ilgili terimlerin bağlanmasına izin vermesidir, örneğin oral bir ilaç için bir dizin girişi, hiyerarşinin aynı seviyesinde diğer oral ilaçları ilgili terimler olarak listeleyebilir ancak tedavi gibi daha geniş terimlere de bağlanabilir. Atama dizinleme, farklı dizinleyicilerin seçebileceği kontrollü bir terim kümesine sahip olacağı için dizinleyiciler arası tutarlılığı iyileştirmek için manuel dizinlemede kullanılır. Kontrollü sözlükler, iki dizinleyicinin konuyu hala farklı şekilde yorumlayabilmesi nedeniyle tutarsızlıkları tamamen ortadan kaldırmaz.[2]
Dizin sunumu
[değiştir | kaynağı değiştir]Dizinlemenin son aşaması, girdileri sistematik bir sırayla sunmaktır. Bu, girdileri birbirine bağlamayı içerebilir. Önceden koordine edilmiş bir dizinde, dizinleyici, bir kullanıcının aramasını nasıl formüle edebileceğini göz önünde bulundurarak terimlerin bir girdide hangi sırayla bağlanacağını belirler. Sonradan koordine edilmiş bir dizinde, girdiler tek tek sunulur ve kullanıcı, çoğunlukla bilgisayar yazılımı tarafından gerçekleştirilen aramalar yoluyla girdileri birbirine bağlayabilir. Sonradan koordinasyon, önceden koordinasyona kıyasla bir kesinlik kaybına neden olur.[6]
İndekslemenin derinliği
[değiştir | kaynağı değiştir]Dizinleyiciler, hangi girdilerin dahil edilmesi gerektiği ve bir dizinin kaç girdi içermesi gerektiği konusunda kararlar almalıdır. Dizinlemenin derinliği, dizinleme sürecinin kapsamlılık ve özgüllük açısından kapsamlılığını tanımlar.[7]
Tükenmişlik
[değiştir | kaynağı değiştir]Kapsamlı bir dizin, tüm olası dizin terimlerini listeleyen bir dizindir. Daha fazla kapsamlılık, daha yüksek bir geri çağırma veya tüm ilgili makalelerin alınması olasılığının daha yüksek olmasını sağlar, ancak bu, hassasiyet pahasına gerçekleşir . Bu, kullanıcının daha fazla sayıda alakasız belge veya yalnızca konuyla çok az derinlemesine ilgilenen belge alabileceği anlamına gelir. Manuel bir sistemde daha yüksek düzeyde kapsamlılık, daha fazla adam-saati gerektirdiğinden daha yüksek bir maliyet getirir. Otomatik bir sistemde harcanan ek zaman çok daha az önemli olurdu. Ölçeğin diğer ucunda, seçici bir dizinde yalnızca en önemli yönler ele alınır. [8] Bir dizinleyici yeterli terim içermezse, son derece ilgili bir makale gözden kaçırılabileceğinden, seçici bir dizinde geri çağırma azalır. Bu nedenle, dizinleyiciler bir denge için çabalamalı ve belgenin ne kullanılabileceğini düşünmelidir. Ayrıca zaman ve masrafın etkilerini de göz önünde bulundurmaları gerekebilir.
Özgüllük
[değiştir | kaynağı değiştir]Özgüllük, dizin terimlerinin temsil ettikleri konularla ne kadar yakından eşleştiğini açıklar [9] Bir dizin, dizinleyicinin belgenin kavramına paralel tanımlayıcılar kullanması ve kavramları tam olarak yansıtması durumunda özgül olarak adlandırılır. [7] Özgüllük, dahil ettiğiniz terim sayısı arttıkça, bu terimler daha dar olacağından kapsamlılıkla birlikte artma eğilimindedir.
Endeksleme teorisi
[değiştir | kaynağı değiştir]Hjørland (2011)[10] indeksleme teorilerinin en derin düzeyde farklı bilgi teorileriyle bağlantılı olduğunu bulmuştur:
- Dizinlemenin rasyonalist teorileri (Ranganathan'ın teorisi gibi), öznelerin mantıksal olarak temel bir kategori kümesinden oluşturulduğunu ileri sürer. Özne analizinin temel yöntemi, temel kategoriler kümesini izole etmek (=analiz) ve daha sonra belirli bir belgenin öznesini bu kategorileri bazı kurallara göre birleştirerek oluşturmak (=sentez) için "analitik-sentetik"tir.
- Deneysel indeksleme teorileri, özellikle sayısal istatistiksel tekniklerin uygulanması yoluyla, benzer belgelerin özelliklerine göre seçilmesine dayanır.
- Tarihselci ve hermeneutik dizinleme teorileri, belirli bir belgenin konusunun belirli bir söylem veya alana göreli olduğunu, bu nedenle dizinin belirli bir söylem veya alanın ihtiyacını yansıtması gerektiğini öne sürer. Hermeneutiğe göre, bir belge her zaman belirli bir ufuktan yazılır ve yorumlanır. Aynı durum bilgi organizasyon sistemleri ve bu tür sistemleri arayan tüm kullanıcılar için de geçerlidir. Böyle bir sisteme yöneltilen herhangi bir soru belirli bir ufuktan yöneltilir. Tüm bu ufuklar az çok fikir birliği içinde veya çatışma içinde olabilir. Bir belgeyi dizinlemek, bu farklı ufuklar hakkında bilgi sahibi olarak "ilgili" belgelerin alınmasına katkıda bulunmaya çalışmaktır.
- Pragmatik ve eleştirel indeksleme teorileri (örneğin Hjørland, 1997)[11] öznelerin belirli söylemlere göreli olduğu tarihselci bakış açısıyla hemfikirdir ancak özne analizinin verili hedefleri ve değerleri desteklemesi ve bir şekilde indekslemenin sonuçlarını dikkate alması gerektiğini vurgular. Bu teoriler, indekslemenin tarafsız olamayacağına ve tarafsız bir şekilde indekslemeye çalışmanın yanlış bir hedef olduğuna inanır. İndeksleme bir eylemdir (ve bilgisayar tabanlı indeksleme, programcıların niyetlerine göre hareket etmektir). Eylemler insan hedeflerine hizmet eder. Kütüphaneler ve bilgi hizmetleri de insan hedeflerine hizmet eder, bu nedenle indekslemeleri bu hedefleri mümkün olduğunca destekleyecek şekilde yapılmalıdır. İlk bakışta bu garip görünüyor çünkü kütüphanelerin ve bilgi hizmetlerinin hedefi herhangi bir belgeyi veya bilgi parçasını tanımlamaktır. Bununla birlikte, herhangi bir özel indeksleme yöntemi her zaman diğerlerinin pahasına bir tür kullanımı destekler. İndekslenecek belgeler bir toplulukta belirli bazı amaçlara hizmet etmeyi amaçlar. Temel olarak indeksleme aynı amaçlara hizmet etmeyi amaçlamalıdır. Birincil ve ikincil belgeler ve bilgi hizmetleri aynı genel sosyal sistemin parçalarıdır. Böyle bir sistemde farklı teoriler, epistemolojiler, dünya görüşleri vb. devreye girebilir ve kullanıcıların kendilerini yönlendirebilmeleri ve bu farklı görüşler arasında gezinebilmeleri gerekir. Bu, alandaki farklı epistemolojilerin haritalanmasını ve tek belgenin böyle bir haritaya sınıflandırılmasını gerektirir. Bu tür farklı paradigmaların ve bunların dizinleme ve sınıflandırma sistemleri üzerindeki sonuçlarının mükemmel örnekleri Ørom (2003)[12] [12] tarafından müzik alanında sağlanmıştır.
Dizinlemenin özü, Rowley ve Farrow'un[13] [14] 1997) sözleriyle, bilgilendirici potansiyellerini dizinlemektir. "İyi ve tutarlı bir dizinleme elde etmek için, dizinleyicinin konunun yapısı ve belgenin bilginin ilerlemesine yaptığı katkının doğası hakkında kapsamlı bir anlayışa sahip olması gerekir" (Rowley ve Farrow, 2000,[13] s. 99).
Kaynakça
[değiştir | kaynağı değiştir]- ^ a b Lancaster, F. Wilfrid (2003). Indexing and abstracting in theory and practice. 3. ed. Londra: Facet. ISBN 978-1-85604-482-0.
- ^ a b Chowdhury, Gobinda G. (2004). Introduction to modern information retrieval. 2nd ed. Londra: Facet. ISBN 978-1-85604-480-6.
- ^ GÜRSES, Reşide; HASANLI, Mehman; TAĞIYEVA, Nurane (2022). Uluslararası Türk Dünyasında Millî Mücadele ve Edebiyat Sempozyumu Bildirileri. Turk Dunyasi Yayınları. ISBN 978-975-17-5192-8.
- ^ Bilton, Helen (Mart 2009). "Society of Indexers fee negotiations survey 2008". The Indexer. 27 (1): 20-24. doi:10.3828/indexer.2009.7. ISSN 0019-4131.
- ^ GÜNAYDIN, Yuşa Çağatay; SOLMAZ, Ramazan (31 Aralık 2023). "İstenmeyen arama, sms/mms veya otomatik arama engelleyici uygulaması". Uluslararası Batı Karadeniz Mühendislik ve Fen Bilimleri Dergisi. 5 (2): 1-12. doi:10.55440/umufed.1380468. ISSN 2687-2927.
- ^ Bodoff, David; Kambil, Ajit (1998). <1254::aid-asi4>3.0.co;2-o "Partial coordination. I. The best of pre-coordination and post-coordination". Journal of the American Society for Information Science. 49 (14): 1254-1269. doi:10.1002/(sici)1097-4571(1998)49:14<1254::aid-asi4>3.0.co;2-o. ISSN 0002-8231.
- ^ a b Cleveland, Donald B.; Cleveland, Ana D. (2001). Introduction to indexing and abstracting. 3rd ed. Englewood (Colo.): Libraries unlimited. ISBN 978-1-56308-641-0.
- ^ Akbulut, Deniz; Acer, Aynur; Paşalı Taşoğlu, Nihal (30 Kasım 2024). "Yatırımcı İlişkileri Aracı Olarak Yıllık Raporların ve Web Sitesinin Kullanımı: Türk Hava Yolları Üzerine Bir Analiz". TAM Akademi Dergisi. doi:10.58239/tamde.2024.02.004.x. ISSN 2822-4493.
- ^ Odabaşoğlu, Alper (24 Mart 2025), Bilgi Bilimi ve Kütüphanecilik Alanında Yapay Zekâ İle İlgili Yayınların Bibliyometrik Analizi, Özgür Yayınları6 Mayıs 2025
- ^ Henkoğlu, Türkay; Külcü, Özgür (30 Nisan 2013). "Bilgi Erişim Platformu Olarak Bulut Bilişim: Riskler ve Hukuksal Koşullar Üzerine Bir İnceleme". Bilgi Dünyası. 14 (1): 62-86. doi:10.15612/bd.2013.135. ISSN 2148-354X.
- ^ Sever, Hayri; Oğuz, Buket (31 Ekim 2002). "Veri Tabanlarında Bilgi Keşfine Formel Bir Yaklaşım Kısım I: Eşleştirme Sorguları ve Algoritmalar". Bilgi Dünyası. 3 (2): 173-204. doi:10.15612/bd.2002.517. ISSN 2148-354X.
- ^ a b Çakmak, Tolga; Külcü, Özgür (31 Ekim 2011). "Kurumsal İçerik Yönetimi Bileşenlerinin Bir Savunma Sanayii Organizasyonu Örneğinde Değerlendirilmesi". Bilgi Dünyası. 12 (2): 263-279. doi:10.15612/bd.2011.197. ISSN 2148-354X.
- ^ a b Hannabuss, Stuart (Aralık 2002). "Organizing Knowledge: An Introduction to Managing Access to Information (3rd ed.)20027Jennifer Rowley and John Farrow. Organizing Knowledge: An Introduction to Managing Access to Information (3rd ed.) . Aldershot and Burlington, VT: Gower 2000. xix + 404 pp., ISBN: ISBN 0 566 08047 8 £25.00 (paperback)". Journal of Documentation. 58 (6): 707-708. doi:10.1108/jd.2002.58.6.707.7. ISSN 0022-0418.
- ^ HJØRLAND, BIRGER (1 Şubat 1992). "THE CONCEPT OF 'SUBJECT' IN INFORMATION SCIENCE". Journal of Documentation. 48 (2): 172-200. doi:10.1108/eb026895. ISSN 0022-0418.