May 15 – 17, 2024
ODTÜ KKM
Europe/Istanbul timezone

Büyük Dil Modelleri ve Güncel Gelişmeler

Özet: Günümüzde bilgi veritabanlarında depolanır. Dünya çapında çeşitli uygulamalar tarafından kullanılan çeşitli veritabanları türleri vardır. Veritabanlarındaki veriler yapılandırılmış bir şekilde depolanır ve veritabanları, veri tabanına özel sorgulama dilleri (örn. SQL) kullanılarak verilere erişim sağlanır. Teknik kullanıcılar için veri tabanı sorguları ile verilere ulaşmak kolay iken, teknik olmayan kullanıcılar veri tabanlarının iç detaylarını anlayamadıkları için zorluk yaşamaktadırlar. Doğal dil sorgulaması (NLQ), bilgi erişiminde bilinen bir sorundur. Veritabanı sorgulama dilleri bilgisi gerektirmeden soruların oluşturulmasına olanak sağlar. Amaç insanların sorgularını kendi dillerinde oluşturmalarını ve verilerden kolayca faydalanmalarını sağlamaktır. Bu sunumda NLQ'nun analizi ve doğal dil ile sorgu oluşturma yöntemleri yapılmakta ve olası araştırma alanları anlatılmaktadır.

Belirli araştırma grupları tarafından yapılacak kısa sunumlar ile büyük dil modelleri ve doğal dil işleme alanında yürütülen çalışmalar hakkında bilgier  verilecektir. Sunumlar sonrasında YBH ile büyük dil modellerinin nasıl eğitileceği, nasıl kullanılacağı konularına değinilmesi planlanmaktadır.

Anahtar Kelimeler: doğal dil işleme, veri tabanları, büyük dil modelleri

Çalışma Grubuna Katkı Sağlayacak Araştırmacılar:

Tuğba Pamay Arslan (İTÜ)

Emre Bektaş (TÜBİTAK BİLGEM)

Nur Bengisu Çam (TÜBİTAK BİLGEM)

İlknur Dönmez (TÜBİTAK BİLGEM)

Arif Görkem Özer (ODTÜ)

Yusuf Mücahit Çetinkaya (ODTÜ)

İlker Kesen (KÜ)

Çağrı Toraman (ODTÜ)

Ulaş Perit ( TURBOARD)

Fırat Çekinel (ODTÜ)

 

Program

9.30 Oturum Açılışı

9.35 Yusuf Mücahit Çetinkaya, ODTÜ: LLMs on Weakly Labeled Datasets

9.45 Tuğba Pamay Arslan, İTÜ: İTÜ Doğal Dil İşleme & LLM Çalışmaları

9.55 İlker Kesen, Koç Ü. :

10.05 Çağrı Toraman, ODTÜ: Adapting Generative Large Language Models for Low-

resource Languages

10.15 Arif Görkem Özer, ODTÜ: Doğal Dilden Veritabanı Sorgusuna

10.25 Nur Bengisu Çam, TÜBİTAK BİLGEM: BİLGEM’de LLM

10.35 Ulaş Pelit, TURBOARD: Unlocking Business Potential: Optimizing Language

Models for Your Unique Case

10.45 Fırat Çekinel, ODTÜ: Cross-Lingual Learning vs. Low-Resource Fine-Tuning: A

Case Study with Fact-Checking in Turkish

10.55 Değerlendirmeler

11.00 Kapanış