Forum: Diğer Konular RSS
Çeviri sistemi için veritabanı
Abdullah #1
Üye Ağu 2015 tarihinden beri · 48 mesaj
Grup üyelikleri: Üyeler
Profili göster · Bu konuya bağlantı
Konu adı: Çeviri sistemi için veritabanı
Bir çeviri uygulaması yapmak istiyorum. Veritabanı noktasında bazı sıkıntılarım var.
Birbiriyle bağlantılı olan kelimeler nasıl gruplandirilabilir?
Mesela, "ben" "beni" "bana" gibi.

Eş anlamlı kelimeler için ne yapılabilir?
(Sorgu yaparken)

Bu gibi sorunlar için yeni bir veritabanı yönetim sistemi tasarlamama gerek var mı?
acehreli (Moderatör) #2
Kullanıcı başlığı: Ali Çehreli
Üye Haz 2009 tarihinden beri · 4538 mesaj
Grup üyelikleri: Genel Moderatörler, Üyeler
Profili göster · Bu konuya bağlantı
Abdullah:
Mesela, "ben" "beni" "bana" gibi.

Türkçe'nin ekler şampiyonu olduğunu düşünürsek o işin sonu yok. :)

Eş anlamlı kelimeler için ne yapılabilir?

Benim fazla bilgim yok ama bu sorunların Google gibi firmalar tarafından yeterince çözüldüğünü biliyoruz.

Bu gibi sorunlar için yeni bir veritabanı yönetim sistemi tasarlamama gerek var mı?

Sanırım kendi verini kendin halletmek isteyeceksin. Daha geçen gün bir arkadaşla ilgisiz bir konuda konuşuyorduk: Ne zaman bir veri tabanı programı kullanmaya kalksalar eninde sonunda onu bırakıp kendi çözümlerini yazmak zorunda kalmışlar. Bunun nedeni, genel kullanımı hedefleyen veri tabanlarının özel amaçlarda yavaş kalabilmesi... Tabii sen de hazır bir veri tabanıyla başlayıp gerekirse başka bir şeyler yazabilirsin.

Ali
erdem (Moderatör) #3
Üye Tem 2009 tarihinden beri · 1005 mesaj · Konum: Eskişehir
Grup üyelikleri: Genel Moderatörler, Üyeler
Profili göster · Bu konuya bağlantı
Yanıtlanan mesaj #1
Aslında veritabanından ziyade kullanacağın veri yapısını seçmen gerekir.

Bunun için de disjoint set  veri yapısını kullanabilirsin.

https://www.topcoder.com/community/data-science/data-scien…

Sanırım bu da aynı konuyu anlatıyor.

http://algs4.cs.princeton.edu/15uf/

Bu veri yapısını kullanan örnek bir uygulama

https://www.youtube.com/watch?v=DsfMcQMwPcI

Bu veri yapısının nasıl kullanıldığını daha önce konuşmuşuz.

http://ddili.org/forum/post/7773

http://ddili.org/forum/post/7785
kerdemdemir #4
Üye Eyl 2013 tarihinden beri · 123 mesaj · Konum: Danimarka
Grup üyelikleri: Üyeler
Profili göster · Bu konuya bağlantı
Aynen bu eki anlama isi cok cetrefilli bir is.

Bu konu basli basina bir arastirma konusu. Benim 5 sene once aldigim NLP dersimden aklimda kaldigi kadariyla Parse Tree diye veri yapilari vardi once kelimenin ozne mi fiil mi nesne mi oldugunu anliyorduk. Bu noktadan sonradan baska veri yapilari ile ekleri anlamlandiriyorduk.

Benim hocam baya bir ugrasmisti bunlarla. Makaleler hep ingilizce turkcelerini bulamadim uzgunum.

https://link.springer.com/chapter/10.1007/978-3-319-22635-…
http://www.aclweb.org/anthology/J08-3003

Saygilar
Abdullah #5
Üye Ağu 2015 tarihinden beri · 48 mesaj
Grup üyelikleri: Üyeler
Profili göster · Bu konuya bağlantı
Herkese teşekkürler. İnglizcem yeterli seviyede değil malesef. Hem yeni şeyler öğrenerek değil de, mevcut bilgilerimle bu uygulamayı geliştirmek istiyorum.

Geçen dizi'nin ram'de kapladığı alanla ilgili bir soru sormuştum. Bunun sebebi aklımdaki düz-dosya veritabanı tasarımıydı. Yani dosyadaki elemanlar diziye aktarıldığında kaç mb yer kaplar merak etmiştim.

Ama şimdi buna da şöyle bi çözüm buldum (belki komik gelebilir bunlar); dosyadan satır satır okunacak ve aynı sabit~ diziye aktarılacak. Mesela sorguda ilk satır okunuyor, diziye aktarılıyor dizide sorgu yapılıyor, sorgu bulunamazsa ikinci satır aynı diziye aktarılıyor... Böylece ram'de kaplayacağı alanı da hemen hemen kontrol edebileceğim.
Doğrulama Kodu: VeriCode Lütfen resimde gördüğünüz doğrulama kodunu girin:
İfadeler: :-) ;-) :-D :-p :blush: :cool: :rolleyes: :huh: :-/ <_< :-( :'( :#: :scared: 8-( :nuts: :-O
Özel Karakterler:
Bağlı değilsiniz. · Şifremi unuttum · ÜYELİK
This board is powered by the Unclassified NewsBoard software, 20100516-dev, © 2003-10 by Yves Goergen
Şu an: 2017-12-16, 08:45:55 (UTC -08:00)