
8. Ulusal Yüksek Başarımlı Hesaplama Konferansı
Günümüzde yeniliğin ve dijital dönüşümün olduğu her yerde izlerini gördüğümüz Yüksek Başarımlı Hesaplama ile ulusal ölçekte yapılan çalışmaları yaygınlaştırmak, geliştirmek, deneyimleri aktarmak ve bu teknolojiyi kullanan paydaşları bir araya getirmek amacıyla sürdürülmekte olan Ulusal Yüksek Başarımlı Hesaplama Konferansı’nın sekizincisi BAŞARIM 2024 başlığı altında düzenlenecektir. Konferans TÜBİTAK ULAKBİM, Orta Doğu Teknik Üniversitesi, Sabancı Üniversitesi, İstanbul Teknik Üniversitesi UHeM, Bilkent Üniversitesi iş birliği ve EuroCC2@Türkiye projesinin desteği ile Mayıs 2024'te, yüz yüze formatta Orta Doğu Teknik Üniversitesi KKM salonlarında gerçekleştirilecektir.
BAŞARIM 2024 hakemli bir konferans olup, gönderilen bildiriler Değerlendirme Komitesi tarafından değerlendirilmektedir.
BAŞARIM Konferansları Serisi: basarim.org.tr
8th High-Performance Computing Conference
With the objective of sharing and evaluating scientific research, experience, studies, and results related to high-performance computing at a national-level scientific event, BAŞARIM 2024 - 8th High-Performance Computing Conference will be held in face-to-face participation in CCC of Middle East Technical University in May 2024 with the cooperation of TÜBİTAK ULAKBİM, Middle East Technical University, Sabancı University, Istanbul Technical University UHeM, Bilkent University and the support of the EuroCC2@Turkey project.
BAŞARIM 2024 is a peer-reviewed conference, and submitted papers are evaluated by the Program Committee.
BAŞARIM Conference Series: basarim.org.tr
|
TÜBİTAK BİDEB 2223-B Programı tarafından desteklenmektedir.
Supported by TÜBİTAK BİDEB 2223-B Program. |

In this talk, I will present a snapshot of the European Chip development efforts. I will start by the motivation of having locally sourced hardware/software ecosystem and the contribution of this ecosystem towards european sovereignty. The focus will be on describing open-source efforts. I will briefly discuss the history of this effort and continue by detailing where we stand currently. I will finalize by outlining the future roadmap with a view towards producing 100% Made in Europe Exascale Supercomputers. Time permitting, I will present the local BSC chip tapeout results.
In modern multi-core architectures with distributed directory-based cache coherence, each memory address is overseen by a distributed directory unit, known as a Caching/Home Agent (CHA), that monitors cache line state and location. Neither the CHA nor core locations in a processor are directly exposed to the programmer. In this work, we firstly analyze and compare the methodologies for uncovering both the CHA and core topology of Intel Xeon Scalable processors, as well as the methods to reveal the mapping of memory addresses to CHAs. Leveraging the topology and the address mapping information, we investigate the impact of spatial proximity between communicating cores and CHAs on application performance, and propose a thread mapping heuristic that assigns threads to cores by considering cache coherence traffic. We evaluate our heuristic on an N-body simulation application that exhibits high amount of on-chip communication traffic. Our heuristic achieves a speedup of up to ~8% and with an average of 4.4% over compact placement.
LLVM yazılım geliştirme ekosistemi için optimize edici derleyiciler, dinamik dil yürütme motorları, kaynak kod analizi ve dönüşüm araçları, hata ayıklayıcılar ve bağlayıcılar ve birçok programlama dili ve araç zinciri ile ilgili bileşenler için vazgeçilmez bir parça haline gelmiştir. Artık hem akademi hem de sanayide yoğun bir şekilde kullanılan LLVM, üretim kalitesinde araçların hızlı geliştirilmesine olanak tanırken, yüksek performanslı bilgisayarlamaya yönelik çalışmalarda giderek daha fazla kullanılmaktadır. Program analizi, derleme, yürütme ve profil oluşturma araştırması ve uygulaması, üzerine inşa edilebilecek yüksek kaliteli serbestçe erişilebilir bir altyapının mevcudiyetinden açıkça fayda görmüştür. Bu çalıştay, yüksek performanslı bilgisayarlamadaki sanat durumunu ilerletmek için LLVM üzerine inşa eden hem akademi hem de sanayiden son gelişmelere odaklanacaktır.
Açılış Konuşması ve Moderasyon: Prof. Dr. Özcan Öztürk
Kuter Dinel - LLVM'e Giriş ve LLVM IR
Emrecan Yiğit - LLVM ile RISC-V Özel Talimatları (Custom Instructions) Destekleme
Eymen Ünay - LLVM içinde Açık Kaynak Just-In-Time Linker ARM Arka Ucu Geliştirimi
The softmax function is a type of activation function that is frequently used in the output layer of a neural network. In large neural networks, the softmax function can become computationally intensive and parallelization of it can provide performance benefits. In this work, we investigate the performance of a softmax function implementation on a shared- and distributed-memory non-uniform computing environments.
Then, we propose a sophisticated workload distribution scheme to improve the parallel performance.
The shared-memory system contains a heterogeneous asymmetric multicore Intel CPU with eight performance and eight efficiency cores. The distributed-memory system contains nodes with different types of quad-core CPUs. The experimental results demonstrate the significant performance advantage of our proposed workload distribution scheme compared to uniform workload distribution.
Safety-critical embedded computer systems employ fault tolerance techniques for hardware errors to deal with extreme environmental conditions. While software approaches maintain reliable executions with replications, redundant codes induce significant performance overheads. Embedded systems with GPU accelerators utilized for safety-critical demanding computations require both performance and reliability. Therefore, it becomes important to evaluate the behavior of redundant executions and make a design choice. In this paper, we implement software-based redundancy techniques for the CUDA programs from a safety-critical domain targeting the GPU resources on the NVIDIA Jetson Xavier NX embedded device and perform a performance-reliability tradeoff analysis for alternative execution scenarios.
We present a 1024-FPGA DES supercomputer accelerator that is automatically compiled from a single-
threaded sequential DES key search application by means of our High Level Synthesis compiler. Our 1024-FPGA
supercomputer is deployed on a number of Amazon Web Services (AWS) EC2 F1 instance platforms from different
AWS regions. Consequently, it can be considered as the first multi-chip application-specific supercomputer that is scattered to multiple geographically distributed data centers around the world. Furthermore, invoking our 1024-FPGA DES supercomputer is functionally identical to invoking the single-threaded sequential DES application the supercomputer accelerator is compiled from. Our 1024-FPGA supercomputer achieves 3.016E+12 keys/sec and it performs 5,286,000 times better than an AWS EC2 m5.8xlarge Xeon x86 machine executing the original sequential application with a performance of 5.706 E+5 keys/sec.
Every new hardware generation of cores promises major performance progress. We will present the results of a detailed performance analysis of INTEL processors between 2007 and 2017 using the well-known SPEC FP 2017. We will show that performance increase cannot only rely on hardware core improvement: the compiler will bring a limited part of the solution, but essentially, better performance analysis and methodologies are required to drive application restructuring. We will briefly describe the MAQAO/ONE VIEW toolset, which has been developed according to this philosophy.
Topic: BASARIM2024-Invited Speaker
Join Zoom Meeting
https://tubitak-gov.zoom.us/j/98114218025?pwd=bWZBYjVmR1lWd0dZK1FoeFZZTW11Zz09
Meeting ID: 981 1421 8025
Passcode: 543327
Son on yılda Coğrafi Bilgi teknolojilerinde önemi giderek artan temel sorunlar, büyük veri, sistem erişilebilirliği ve yüksek donanım maliyetleri olmuştur. Örneğin, Türkiye Ulusal Coğrafi Bilgi Sistemi (TUCBS) Altyapısı ve Avrupa INSPIRE Geoportal'i gibi devasa coğrafi altyapı projeleri, yalnızca coğrafi büyük veri yönetimini değil, aynı zamanda yüke dayanıklı ve uygun maliyetli bir BT altyapısı da gerektirmektedir. Bu zorlukların üstesinden gelmek için, bu çalışmada İTÜ Ulusal Yüksek Başarımlı Hesaplama Merkezi sunucuları kullanılarak açık kaynaklı, yüksek performanslı, uygun maliyetli bir Infrastructure-as-a-Service (IaaS) OpenStack bulut altyapısı önerilmiştir. Bu bağlamda, öncelikle açık kaynaklı yazılım olan OpenFiler iSCSI yazılımı OpenStack'e entegre edilerek "Software-Defined Storage (SDS)" elde edilmiştir. Sistemin genel verimini artırmak için Software-Defined Storage kısmında açık kaynaklı bir Linux programı kullanılmış ve akabinde en performanslı RAID seviyesini bulmak için testler yapılmıştır. Son olarak, performans artışını doğrulamak ve karşılaştırmak için tüm yük testlerinin sonuçları literatürdeki diğer çalışmalarla karşılaştırılmıştır. Deneysel sonuçlar, önerilen iyileştirilmiş OpenStack IaaS ortamının 49520 IOPS verime, 426 MB I/O throughput'a ve 526 ms latency'e ulaştığını, böylece diğer çalışmalara nazaran daha az maliyetle daha iyi performans gösterdiğini teyit etmiştir. Bu yüzden önerilen altyapı, mekânsal büyük verinin performanslı şekilde analiz edilip sunulması açısından, literatüre örnek niteliğinde olumlu katkı sağlamıştır.
RISCV Komut Seti Mimarisi (ISA), açık donanıma yönelik bir çerçeve platformu oneriyor. Bu tartışma bölümünde, Türkiye'de ve dünyada RISCV donanım geliştirme alanındaki son gelismeleri tartışmayı öneriyoruz. Mevcut RISCV çip geliştirme çabasını tartışarak, RISCV tabanlı donanım/yazılım açık kaynaklı HPC/IOT/Embeeded Ekosistemi oluşturmak için HPC kaynakli potansiyel bir yol haritası sunacağız. RISCV'nin IoT pazar segmentindeki nispeten daha olgun konumu göz önüne alındığında, RISCV'nin HPC donanım ekosisteminde yıkıcı olup olmayacağını tartışacağız. Görüşmelerde ayrıca RISCV konusunda uzman bir çalışma grubu oluşturulması amacıyla Türkiye ve yurtdışındaki mevcut RISCV tabanlı projeler de özetlenecek.
Çizelgeleme, işlemci kaynağının verimli kullanılması ve maksimum fayda sağlanması için işlemlerin sıralanması ve düzenlemesi işlemidir. Birden fazla işleme sahip iş akışlarının sisteme varış zamanının önceden bilinmemesi durumunda çizelgeleme problemi dinamik bir optimizasyon problemine dönüşmektedir. Literatür çalışmalarında veri paralel işlemler içeren iş akışlarının dinamik çizelgelenmesi problemi üzerine yapılan çalışmalar oldukça kısıtlıdır. Bu çalışmada homojen işlemci kaynakları üzerinde veri paralel işlemlere sahip iş akışlarının dinamik çizelgelenmesi problemi ele alınmıştır. İşlemci tahsisinde çeşitli açgözlü sezgiselleri kullanan hiper-sezgisel bir yöntem kullanılmıştır. Çizelgelemede ise genetik algoritma kullanılarak meta-sezgisel yaklaşım sunulmuştur. Deneysel çalışmalarda yeni nesil dizileme analizi iş akışları gibi gerçek dünya uygulamaları ve standart işlem çizgeleri kullanılmıştır.
Computing betweenness centrality (BC) in large graphs is crucial for various applications including telecommunications, social, and biological networks. However, the huge size of data presents significant challenges. In this paper, we introduce a novel approximate approach for efficiently extracting top-k BC nodes using a combination of Louvain community detection and Brandes’ algorithm. Our method significantly enhances the runtime efficiency of the traditional Brandes’ algorithm while
preserving accuracy across synthetic and real-world datasets. Additionally, our approach is suitable to parallelization, further improving its efficiency. Experimental results confirm the effectiveness of our method for large, sparse graphs.
GPUs have emerged as the forefront technology in high performance systems utilized for artificial intelligence and scientific computations. A significant portion of computational tasks involves graph traversals, and computations associated with large graph traversal. Graphs containing billions of vertices have been employed to represent a wide array of real-world problems. Consequently, accelerating graph processing algorithms is a matter of great interest in many fields.
Kernel fusion has been proposed in previous studies as a means of fusing computational kernels in parallel jobs to optimize their performance. As kernel fusion's fundamental idea is sharing resource access to increase utilization by multiple jobs, it is even better suited for GPUs that run hundreds of jobs in parallel than CPUs that run a few jobs in parallel.
However, kernel fusion is itself a computationally expensive operation that incorporates control flow changes and manipulation of the order of execution for computational jobs. As such, kernel fusion is harder to utilize on GPUs compared to CPUs.
This work presents a streamlined kernel fusion framework for concurrent graph processing on GPUs. The framework facilitates the definition and implementation of graph jobs that can be executed in parallel on GPUs. The kernel fusion algorithm, integrated into the framework, automatically combines these jobs to enhance performance. Additionally, the framework introduces novel data handling structures and a meta-compiler that enables static polymorphism, allowing multiple different jobs to run efficiently as a job queue on the GPU without the performance overhead typically associated with polymorphism.
The effectiveness of the framework is evaluated by defining four common graph jobs and running up to 100 parallel instances of these jobs in homogeneous manners, both with and without kernel fusion, resulting in improvements ranging from 2% to 10% when employing kernel fusion.
Yarışmacılar en fazla 2 yansı ile 5 dakika boyunca tezlerini BAŞARIM 2024 konferansında jüri üyelerine sunacaktır. Yansılar ve sunum için dil Türkçe ya da İngilizce’dir. En başarılı 3 yarışmacıya konferansın son günü ödülleri takdim edilecektir.
Topic: BASARM2024-5 Dakikalık Tez Yarışması
Join Zoom Meeting
https://tubitak-gov.zoom.us/j/95333926048?pwd=eW13TFJkMVUvSW5XS1hUQWpYNHR0Zz09
Meeting ID: 953 3392 6048
Passcode: 150039
Uçak kanatlarının sonlu yapısı nedeniyle, kanat alt ve üst yüzeylerinde oluşan farklı basınçlara sahip hava akımları kanat ucu ve firar kenarında karşılaşır. Bu olay sonucunda indüklenmiş sürüklenmeyi artıran ve kanadın aerodinamik verimini azaltıcı etki yapan kanat ucu girdapları oluşur. Bu çalışmada; kuş kanat yapısından esinlenilerek biyotaklit yöntemle kanat ucu girdaplarını azaltıcı uç tasarımının
yapılması amaçlanmıştır. Sayısal çözümlemenin doğruluğunun kanıtlanması amacıyla NASA tarafından üzerinde deneysel ve sayısal çalışma yapılmış olan ONERA M6 kanadı kullanılmıştır. ONERA M6 kanadı etrafındaki akış SOLIDWORKS yazılımı ile modellenmiştir. Katı modeli oluşturulan kanat etrafındaki
akış bölgesi, ANSYS-Fluent yazılımında sonlu hacimlere bölünmüştür. Oluşturulan sayısal modelin doğruluğunun gösterilmesi amacıyla literatürdeki deneysel çalışma koşulları kullanılarak basınç katsayısı değişimleri üzerinde doğrulama analizi yapılmıştır. Doğrulama çalışması sonrasında ONERA
M6 kanadının ucuna 60 derece süpürme açısında ve farklı kıvrım açılarında eklenmiş olan NACA 4412 kanatçık profili için çeşitli hücum açılarında hesaplamalar yapılmıştır. Kaldırma katsayısı / direnç katsayısı (CL/CD) olarak bilinen aerodinamik performans parametresi için en yüksek değeri sağlayan geometrik yapılandırma belirlenmiştir. Çalışmadan elde edilen sonuçlar göstermektedir ki; en yüksek CL/CD oranı 15o kıvrım açılı uç kanatçık için 3.06o hücum açısındaki akışta ortaya çıkmaktadır. Ayrıca; çalışmada 1. tasarım olarak adlandırılmış olan ikili uç kanatçık tasarımının (üst kanatçığın daha uzun ve 15o kıvrım açılı, alt kanatçığın daha kısa ve -30o kıvrım açılı) CL/CD oranında düz kanada göre %27.3 düzeyinde bir iyileşme sağladığı hesaplanmıştır.
Günümüzde bilgi veritabanlarında depolanır. Dünya çapında çeşitli uygulamalar tarafından kullanılan çeşitli veritabanları türleri vardır. Veritabanlarındaki veriler yapılandırılmış bir şekilde depolanır ve veritabanları, veri tabanına özel sorgulama dilleri (örn. SQL) kullanılarak verilere erişim sağlanır. Teknik kullanıcılar için veri tabanı sorguları ile verilere ulaşmak kolay iken, teknik olmayan kullanıcılar veri tabanlarının iç detaylarını anlayamadıkları için zorluk yaşamaktadırlar. Doğal dil sorgulaması (NLQ), bilgi erişiminde bilinen bir sorundur. Veritabanı sorgulama dilleri bilgisi gerektirmeden soruların oluşturulmasına olanak sağlar. Amaç insanların sorgularını kendi dillerinde oluşturmalarını ve verilerden kolayca faydalanmalarını sağlamaktır. Bu sunumda NLQ'nun analizi ve doğal dil ile sorgu oluşturma yöntemleri yapılmakta ve olası araştırma alanları anlatılmaktadır.
Belirli araştırma grupları tarafından yapılacak kısa sunumlar ile büyük dil modelleri ve doğal dil işleme alanında yürütülen çalışmalar hakkında bilgier verilecektir. Sunumlar sonrasında YBH ile büyük dil modellerinin nasıl eğitileceği, nasıl kullanılacağı konularına değinilmesi planlanmaktadır.
Farklı Lattice Boltzmann Yöntemleri arasında Entropik Lattice Boltzmann Yöntemi özellikle sıkıştırılabilir rejimdeki akışları çözmek için revaçta bir durumdadır. Yöntemin ana mantığı, çarpışma adımını yarı-denge koşulunu da içerecek şekilde iki parçaya bölerek, çift dağılım fonksiyonunun entropi kısıtı altında yüksek dereceli çok hızlı örgüler üstünde açılması üstüne kuruludur [1]. ELBM, doğası gereği zamana bağlı ve direkt bir çözüm yöntemidir. Bu makale, yöntemin temelini, matematiksel altyapısını ve uygulamasını kısaca içermektedir. Ana odak, küre etrafındaki ses üstü akış ve şok tüpü gibi doğrulama çalışmaları üzerinden yöntemin kabiliyetlerinin gösterimi üzerinedir. ELBM yönteminin yüksek başarımlı çözüm kümesi üzerinde verimliliği de incelenmiştir.
This study employs direct numerical simulation (DNS) to investigate turbulent boundary layers (TBLs) under varying pressure gradients, which requires high-performance computing (HPC) capabilities. Our research utilises an in-house turbulent boundary layer direct numerical simulation (TBLDNS) code, and in this study, we have assessed the performance of our code in two distinct HPC architectures. Our results reveal that optimised HPC environments yield substantially better performance compared to unoptimised ones. Furthermore, our results show that the TBLDNS code can scale across various HPCs, architectures, and environments. The results obtained from this study will be utilised in turbulent flow analysis, contributing to our understanding of pressure gradient TBLs.
Join Zoom Meeting
https://tubitak-gov.zoom.us/j/96623757747?pwd=Z1c3RTEzeXBtdHUyOW5ObHFRdEh0QT09
Meeting ID: 966 2375 7747
Passcode: 859238
Optimization, an integral aspect of engineering, presents formidable challenges in problem-solving. Many of these engineering dilemmas encountered in daily life confront the NP-Hard complexity class, posing substantial hurdles to attaining optimal solutions. Instead, engineers often resort to heuristic methods to procure feasible solutions within reasonable timeframes. These challenges manifest in various realms of operations research, where combinatorial optimization problems emerge as daunting obstacles. Tasks ranging from task assignment to route optimization, crew scheduling, and factory planning encapsulate the breadth of these issues.
Taking a closer look, specific scenarios further accentuate the breadth of combinatorial optimization's domain. Consider, for instance, the intricacies of optimizing robot trajectory planning or the meticulous analysis required for determining the optimal configuration of graphene structures. Moreover, the exploration of quantum optimization opens new avenues for discovering novel chemical materials, presenting promising yet intricate challenges in optimization. Additionally, the pursuit of optimal structural design to mitigate resonance in production processes underscores the diverse applications of optimization across industries.
Despite advancements, the efficacy of quantum optimization algorithms designed for these challenges faces constraints due to prevalent noise levels in contemporary quantum computing. Consequently, there's a growing interest in developing optimization algorithms with shallower depth, aimed at circumventing these limitations. The strategic implementation of such algorithms holds the potential to yield cost-effective solutions, thus reshaping industrial landscapes.
With recent advancements in High-Performance Computing (HPC) infrastructure and parallel computing, the Lattice-Boltzmann method has emerged as an efficient and parallelizable algorithm for Computational Fluid Dynamics (CFD) applications. The present study investigates the viscous flow over a circular cylinder as a validation test case using the Lattice-Boltzmann Method (LBM) with OpenLB flow solver. Parallel numerical simulations are performed for the prediction of the drag coefficient and Strouhal number at different Reynolds numbers. Flow simulations are performed at Reynolds numbers ranging from 20 to 200 to observe both steady-state and unsteady flow characteristics by vortex shedding. Aerodynamic drag coefficient and Strouhal number are compared with previous experimental and numerical studies in the literature. The accuracy and reliability of the LBM method for simulations of separated vortical flows around a circular cylinder at low Reynolds numbers are discussed in detail. Computational cost analyses of the parallel simulations are also presented and discussed.
This study presents an analysis of the parallel computing performance of the Vertical-Axis Wind Turbine CFD simulations on a HPC cluster. The efficiency and scalability of flow simulations are evaluated in the parallel computing environment, thereby providing valuable insights into their suitability for complex rotor aerodynamic simulations.
2D unsteady CFD simulations are performed by using OpenFOAM with the Sliding Mesh Interface methodology. The unsteady flow around the VAWT rotor test case is solved and presented as the velocity and vorticity contours, and the flow and wake development are observed. Each blade's power production over time is investigated showing that each blade has its own unique torque pattern and an uneven contribution to the total power production. Finally, the parallel speedup and efficiency of the simulations are assessed and the parallel computing performance is evaluated and discussed.
In the present study, the numerical modeling and simulations of a Floating Offshore Wind Turbine (FOWT) are presented. The analyses are carried out utilizing a variety of open-source codes and run on a High-Performance Computing (HPC) environment. The analysis is performed on the NREL 5 MW turbine atop the OC3 Hywind SPAR floating platform. The result shows that the multi-threading computation reduces the computational time for the hydrodynamic platform significantly. Despite using a serial code, the performance analysis of a single wind turbine can benefit from the batch simulation with multiple runs for multiple input scenarios. On a wind farm scale, a combination of the multi-threading and the batch simulations is effective in reducing the computation time. Extraction of power from the wind causes the wind velocity behind the turbine to be lower than the ambient velocity. The wake effect is stronger near the turbine downstream of the rotor. The rotor wake then diffuses and expands as it travels downstream causing the turbine located further behind the upstream turbine to produce more power than the closer one. The wake steering performed by yawing the upstream turbine with the correct yaw angle also proved to be able to increase the collective power production of the wind farm.
İvmelenme yeteneği, su altı araçlarının manevra performansını değerlendirmek için kritik öneme sahip olan temel bir parametredir. Aracın operasyonel isterleri genellikle bu yeteneğe ilişkin asgari bir ölçüt dikte eder. Bu ölçüt önceden belirlenmiş bir hıza ulaşmak için gereken azami zamanı tanımlar ve tasarımın her aşamasında doğrulanması gereklidir. Bu gereksinimin karşılanabilmesi, her bir tasarım aşamasında farklı hesaplama yöntemlerinin kullanımını zorunlu kılar. Sayısal veya deneysel yöntemler aracın ancak tasarımın nihai aşamalarında kesinleşebilecek detaylı geometrisine ihtiyaç duyan pahalı yöntemleridir. Buna karşın tasarımın başlangıç safhalarında yarı deneysel verilere dayanan kapalı form (analitik) çözüm yöntemleri kullanılabilecek en temel ve düşük maliyetli hesaplama araçlarıdır. Bu çalışmanın amacı, sualtı aracı tasarımının farklı safhalarında aracın ivmelenme performansının değerlendirilmesinde kullanılabilecek farklı yöntemlerin karşılaştırılmasıdır. Çalışma kapsamında öncelikle jenerik bir denizaltı formunun gerek yarı deneysel gerekse de hesaplamalı akışkanlar dinamiği (HAD) analizleri ile elde edilen hidrodinamik katsayıları, kapalı form çözüm yöntemlerinde kullanılarak bir çözüm elde edilmiştir. Ayrıca İ.T.Ü. Ulusal Yüksek Başarımlı Hesaplama Merkezi (UHeM) altyapısı kullanılarak HAD ortamında zamana bağlı doğrudan manevra simülasyonları (DMS) icra edilmiştir. Neticede yarı deneysel verilere dayalı kapalı form çözüm yöntemlerinin tasarımın erken aşamaları için kabul edilebilir bir doğrulukta sonuç üretebildiği ancak daha yüksek doğruluk seviyesinin arzu edildiği durumlar için gelişmiş yöntemlerin kullanımının zorunlu olduğu değerlendirilmiştir.
This study focuses on developing an accurate and high-performance compressible flow solver, employing the discontinuous Galerkin method with spectral accuracy across a broad range of flow regimes, spanning from subsonic to hypersonic. The solver is implemented using the libParanumal
library, equipped with solvers for both GPU and CPU, facilitated by OCCA, an open-source library serving as a portability layer for offloading targeted kernels across diverse architectures and vendor platforms. The superior high-order accuracy of the solver is validated and demonstrated through various test cases.
Blok zincir teknolojileri dijitalleşme ile birlikte günümüzde endüstriyel sistemlerin alt yapısını oluşturmaktadır. Dünya ülkelerinin Endüstri 4.0’a geçiş hızı farklılık göstermekle birlikte her ülke Endüstride farklı alanlarda kullanmaya başlamıştır. Endüstri 4.0 ile birlikte bulut hesaplamalar, büyük veri uygulamaları finansal sistemlerde ve muhasebe bilgi sisteminde hızdan ve maliyetten önemli kazançlar sağlamıştır. İstihdam konusunda olumsuz etkilerinden söz edilirken; maliyet, tedarik zinciri, üretim hızı, verilerin hızlı ulaşımı, kontrol ve iyileştirme uygulamalarını kolaylaştırıyor olması olumlu etkileri arasında sayılabilmektedir. Büyük veri ve bulut hesaplama iletişim sistemleri büyük alan kaplayan verilerin saklanması ve hızlı ulaştırılmasına katkı sağlamaktadır. Dağınık halde bulunan verilerin disipline edilmiş şekilde kümelenmesi, ilişkili gruplara ayrılması, sınıflandırılması ve kodlanmış halde ilgili endüstriyel birimlere ulaştırılması yolunu oluşturmaktadır. Kripto varlıkların yaygın kullanılması fayda ve zararı beraberinde getirmiştir. Kripto varlıklar temelde blok zincir teknolojiler üzerine oturmuş hesaplamalı bilim ve mühendislik uygulamalarıdır. Kripto varlıkların finansal olarak getiri sağlaması bu varlıkların kayıt altına alınması ve vergisel açıdan değerlendirilmesi sorununu beraberinde getirmiştir. Kripto varlıklarının muhasebeleştirilmesi, kayıt altına alınması, entegre raporlanması ve analiz edilebilir hale getirilmesi muhasebe bilgi sisteminden faydalananlar için bir ihtiyaç haline gelmiştir. Blok zincir uygulamaları, dijitalleşme, bulut hesaplama, büyük veri uygulamaları finansal sistemlerden ayrı düşünülemez. Birlikte etkileşimi ve uygulamada kullanımı açısından değerlendirmeler yapılarak eksiklikleri ve faydalı olduğu yönlerin belirlenmesi gerekmektedir. Blok zincir teknolojilerinin muhasebe bilgi sistemine, endüstriyel uygulamalara ve finansal sistemi üzerine eleştirel bir bakış açısı ile değerlendirilmesi gerekmektedir.
Kaczmarz algorithm is an iterative projection method for solving system of linear equations that arise in science and engineering problems in different domains. In addition to classical Kaczmarz, randomized and parallel variants have been proposed. The main issue for a parallel approach is that each Kaczmarz iteration depends on the previous one, therefore the requirement of communicating frequently results in a large overhead. In this study, a new distributed parallel approach that reduces the communication overhead is proposed. The proposed scheme partitions the problem so that the Kaczmarz iterations on different blocks are less dependent. Frequency constant in our method is being used for adjusting the communication frequency. We also decrease the communication overhead by allowing communication between processes only if they have the shared non-zero column. The sequential experiments are performed using problems from different domains to compare the effects of various partitioning methods on the communication overhead and performance. Finally, we show parallel speedup of the proposed scheme on larger problems.
Zengin polimorfizm aralığı sebebiyle ileri nanoteknolojik uygulamalarda kullanılmak için çok umut verici bir malzeme olan ZnO’in çeşitli fiziksel, elektronik ve termal özelliklerinin farklı polimorf fazlarında çalışılması, üstün cihazlar tasarlanabilmesi için önemli hale gelmektedir.
Bu doğrultuda, bu çalışmada ZnO malzemesinin polimorfizmini hesaplamalı malzeme bilimi teknikleri kullanarak termal genleşme davranışı açısından inceledik. Farklı ZnO polimorf yapılarının termal genleşme davranışını izlemek için hem klasik mekanik hem de kuantum mekanik moleküler dinamik simülasyon hesaplamaları kullanıldı. Bilinen ZnO fazlarından çeşitli hipotetik polimorf yapılar ile gözenekli zeolit benzeri çerçevelere kadar toplamda 25 farklı polkimorf yapı incelenmiştir. Bu ele alınan polimorf yapılar arasında, LTL, FAU gibi zeolite benzeri yapılar ile gözeneklendirilmiş kesik WZ yapısı hariç tüm yığın yapılar için pozitif termal genleşme gözenek açılarak tüm polimorf yapılar pozitif termal genleşme ölçülmüştür. Gözeneklendirilmiş kesik WZ yapısı için en büyük negatif termal genleşme davranışı hesaplanmış olup, zeolitik fazlar için termal genleşme davranışı, malzemenin yoğunluğuna bağlı olarak değiştiği gözlemlenmiştir. Bu sonuçlara dayanarak düşük yoğunluğun, malzeme içindeki boşluk alanını artırarak negatif termal genleşme davranışını artırdığı sonucuna varılmıştır.
The delicate interplay between chromatin binding proteins and the nucleosome core particle orchestrates fundamental cellular processes. While the 147 bp DNA wrapped around four pairs of highly conserved core histones presents a seemingly symmetrical stage, we find a captivating asymmetry in protein binding affinities tunable by the DNA sequence on each side. Using atomistic molecular dynamics simulations and meticulous structural analyses, we unveil that chromatin factors Sir3, PRC1, RCC1, and
SAGA-DUB prefer the nucleosomal gyre that binds DNA more strongly also. However, another factor, known as 53BP1 prefers the gyre with the weaker DNA binding affinity. We speculate that some chromatin interactors can sense the affinity of the nucleosome's core octamer to DNA to achieve specific functional and DNA-templated outcomes such as transcription, replication or repair.
Keywords—chromatin, nucleosome, molecular dynamics, computational biophysics
İlgili oturumda ülkemizde desteklenen Yüksek Başarımlı Hesaplama (YBH) Merkezlerin tanıtımı ile başlanacaktır. Yüksek Başarımlı Hesaplama ve Yapay Zekanın (YZ) günümüzde birbirine yakınsama ile ortak yüksek başarımlı hesaplama altyapıları yapay zeka araştırmaları için verimli olarak kullanılabilmektedir. Yapay zeka ve yüksek başarımlı veri analitiği alanında çalışmaları gerçekleştiren araştırmacıların YBH merkezlerindeki altyapıları kullanımının kolaylaştırılması ve kullanılan araçlar bu çalışma grubunda birlikte tartışılacaktır.
Bu çalışma grubu, YZ ve YBH alanındaki pratik uygulamalar ve teknolojiler üzerine odaklanacaktır. Katılımcılar, geleneksel ortam hazırlığı yanı sıra konteyner tabanlı çalışma yöntemlerini keşfedecek, NVIDIA'nın katalogu üzerinden hazır konteynerleri YBH ortamlarında oluşturma ve çalıştırma süreçleri hakkında bilgi edinebileceklerdir. Çalışma grubu, Python tabanlı YZ geliştirme ortamları, CPU ve GPU tabanlı hesaplama senaryoları, tek ve çoklu GPU kullanımı, ayrıca konteyner teknolojilerinin YZ projelerine getirdiği esneklik ve verimlilik avantajlarını detaylandıracaktır.
YBH ve YZ arasındaki sinerji, konteyner tabanlı çalışma ile önemli ölçüde artırılabilir. Bu çalışma grubu, katılımcılara, YBH ortamlarında YZ çalışmları için uygun ortamın oluşturulması veya konteyner teknolojilerini kullanmanın kolaylıklarını ve potansiyel uygulama alanlarını gösterecektir. Bu, katılımcılara projeleri için doğru teknolojiyi seçme ve YBH ortamlarında YZ projelerini hızlandırma konularında pratik bilgiler sunacaktır.
Antibiotic resistance presents a significant challenge to public health, as bacteria can develop resistance to antibiotics through random mutations during their life cycles, making the drugs ineffective. Understanding how these mutations contribute to drug resistance at the molecular level is crucial for designing new treatment approaches. Recent advancements in molecular biology tools have made it possible to conduct comprehensive analyses of protein mutations. Computational methods for assessing molecular fitness, such as binding energies, are not as precise as experimental techniques like deep mutational scanning. However, while full atomistic alchemical free energy calculations offer the necessary precision, they require significantly more computational time. We created a computational library using deep mutational scanning for dihydrofolate reductase (DHFR), a protein commonly studied in antibiotic resistance research. Due to resource limitations, we analyzed 33 out of 159 positions, identifying 16 replacements. Calculations were conducted for DHFR in its drug-free state and in the presence of two different inhibitors. With the enhancements in computational resources and their optimized use, we demonstrate the feasibility of such calculations.
Blockchain technology has the potential to extend beyond its traditional use in cryptocurrency and make significant strides in critical sectors like healthcare. Clinical research, which plays a pivotal role in enhancing the quality of healthcare by guiding activities, determining equipment usage, and recommending preferred medications, stands to benefit greatly from blockchain integration. The unique technical capabilities of blockchain offer promising solutions across various stages of clinical research, from study design and patient registration to documenting study findings. By addressing current challenges in the clinical research process, blockchain technology can notably enhance research quality and consequently, improve patient care. Although there are conceptual frameworks regarding blockchain in the literature, yet practical implementations remain relatively scarce. Thus, in this study, private permissioned Hyperledger Fabric blockchain platform developed for managing clinical research. Additionally, a use case includes a blockchain-based solution as an innovative distributed framework to counting problems related to COVID-19 epidemiological parameters and statistics among healthcare disciplines and countries has been defined in the study. Also, use case logic has been implemented as a smart contract (chaincode) and invoked on Fabric Network. This endeavor represents a crucial step towards bridging the gap between theoretical understanding and real-world application within the realm of blockchain technology. By deploying a functioning clinical research network and executing smart contracts, this study not only contributes to the practical utilization of blockchain but also serves as a foundation for further research and development in the field.
Gliomalar, en sık görülen malign primer beyin tümörleridir. Sağ kalım olasılıkları, uygulanan tedaviler ve prognoz süreçleri, Düşük dereceli gliomalar (DDG) ve yüksek dereceli gliomalar (YDG) için farklı olduğundan, erken safhada bu ayrım yada sınıflandırma ciddi bir önem taşımaktadır. 2016'dan itibaren genomik moleküler işaretçiler de Dünya Sağlık Örgütü (DSÖ) sınıflandırmasına dahil edilmiştir. Fakat, moleküler genetik test maliyetlerinin çok fazla olması ve testlerin kolayca ulaşılamaz olması ile sonuçların elde edilme süreci haftalarca sürebilmekte, bu da kritik tedavi kararlarının gecikmesine neden olabilmektedir. Bu problemlerin üstesinden gelebilmek için, makine öğrenmesi ve derin öğrenme gibi, çeşitli klasik yapay zeka yöntemleri bu alanda ki problemlerin çözümüne uygulanmakta ve belirli düzeyde sonuçlar elde edilmektedir. Fakat, medikal veri boyutlarının sürekli artması, verilerin sahip olduğu gürültü seviyesi, zayıf çözünürlük gibi problemler, günümüzdeki klasik yapay zeka yöntemlerinin üstesinden gelmekte zorlandığı en önemli sorunlardan bazılarıdır. Son yıllarda yapılan çalışmalar göstermiştir ki, sağlık alanında kuantum hesaplama ve kuantum yapay zeka teknolojilerinin kullanımı, bu problemleri çözmenin yanı sıra, karmaşık veri analizlerini hızlandırmakta ve büyük veri setlerini daha verimli bir şekilde işleyebilmektedir. Bu çalışmada, NISQ kuantum bilgisayarları ile uyumlu, daha az devre elemanına sahip bir varyasyonel kuantum sınıflandırıcı modeli önerildi ve Kanser Genom Atlası (TCGA) verileri kullanılarak DDG ile YDG sınıflandırma noktasında, 0.75 doğruluk değeri elde edildi.
Join Zoom Meeting
https://tubitak-gov.zoom.us/j/93091160178?pwd=VHJ0UUEwcUJTNzhIcm5QN0VkYjFRdz09
Meeting ID: 930 9116 0178
Passcode: 497969
Avrupa Bilişim Ekosistemi'nin içerisinde yer alan ülkemizdeki Yüksek Başarımlı Ulusal Yetkinlik Merkezi'nin kurulması ve sürdürülmesini sağlayan EuroCC projeleri içerisinde yer alan araştırmacıların, ilk kez yüzyüze BAŞARIM2024 Konferansına katılımı ile birlikte, tanışma ve tartışma hedeflenmişitr.
Anders will present his organisation, the European High Performance Computing Joint Undertaking
(EuroHPC JU). The EuroHPC JU joins together the resources of the European Union, 34 European countries
and 3 private partners to develop a World Class Supercomputing Ecosystem in Europe.
Anders will describe the first operational EuroHPC supercomputers located across Europe and give details
about their access policy.
Anders will then present some of the JU’s current objectives, with a focus on the implementation of
ambitious research and innovation programmes supporting European technological and digital autonomy,
and the developing of green technologies in HPC.
This paper introduces an innovative project intersecting style transfer and virtual reality (VR) technologies aimed at enhancing auditory-visual experiences, particularly in the realm of music. Our dynamic platform empowers musicians, spanning from novices to experts, to tailor their compositions within engaging environments enriched with stylized visual and auditory elements. Using deep learning methodologies such as Traditional Neural Style Transfer (TNST) and Neural Neighbor Style Transfer (NNST) in conjunction with VR technology, our framework enables users to craft personalized experiences aligned with their preferences. In this paper, we demonstrate a hybrid approach to style transfer that integrates NNST with conventional techniques and leverages multi-GPU processing for enhanced efficiency. Despite inducing a 19% slowdown compared to NNST alone, our user survey confirmed the enhanced realism of images generated via the hybrid method. Furthermore, we have achieved limited acceleration through multi-GPU support. In conclusion, we have developed a hybrid style transfer method from 2D to 2D and seamlessly integrated it into our VR environment. The envisioned extension of style transfer from 2D to 3D necessitated adaptation to overlay 2D images onto 3D objects due to the processing limitations of VR goggles.
Görüntü iyileştirme ve bilgisayarlı görü gibi çeşitli veri analitiği problemlerinde derin öğrenme yöntemleri yenilikçi ve etkin bir çözüm olarak kullanılmaktadır. Derin öğrenme modelleri sayesinde probleme özgü öznitelikler çıkarılmakta ve pratik bir şekilde sonuç alınmaktadır. Bu makalede, bir analiz çalışması olarak imge süper-çözünürlük problemleri için tasarlanmış derin öğrenme modelleri için sonuç çıkarım modeli ele alınıp hızlı prototiplemeye kolaylık sağlayan eniyileyiciler incelenmektedir. Çalışmamızda bu modellerin grafik işlemcide TensorRT eniyileyici ve işlemcide OpenVINO eniyileyici yöntemlerinin sonuç çıkarım performansları açısından karşılaştırmalı olarak analiz edilmektedir. Karşılaştırmalı analizler sonucunda süper-çözünürlük sonuç çıkarım modellerinin etkin ve verimli hesaplamasına katkı sağlayan sonuçlar literatüre sunulmaktadır.
Video ve imgeleri ölçeklendirmek için kullanılan bir algoritma olan bikübik üst-örnekleme, son zamanlarda derin öğrenme tekniklerinin kullanımı sayesinde evrişimsel sinir ağları ile görüntü işleme alanında uygulanmaktadır. Bu çalışmada, evrişimsel sinir ağı ile tasarlanmış Bicubic++ modeli için çıkarım uygulaması ele alınmaktadır. Sonuç çıkarımı için model CUDA hesaplama mimarisi kullanılarak gerçeklenmekte ve gerçek zamanlı bir şekilde GPU mimarisinde çalıştırılmaktadır. Bu makalede, gerçekleştirilen hesaplama tasarımı için CUDA organizasyonu ve yapılan iyileştirmeler kapsamlı bir şekilde anlatılmaktadır. Bu çalışma ile literatüre Bicubic++ modeli için ilk CUDA C/C++ gerçeklemesi sunulmaktadır.
Yapay zeka perspektifinde güncel makine öğrenmesi kabiliyetlerine katkı sağlamış çalışmaların temelinde Tekrarlayan Yapay Sinir Ağları (RNN) yöntemini de görüyoruz. Bir RNN mimarisini genel anlamda, katmanlara dağılmış ve birbirleri ile tam bağlantılı olan tekil algılayıcılar (perceptron) olarak düşünebiliriz. Tekil algılayıcılar ise biyolojik sinir ağlarının aktivitesini model alarak geliştirilmiştir. Her bir tekil algılayıcının kendisine komşu her tekil algılayıcı ile tam bağlı olması ve bunun yanında ele aldığı problem verilerinin çok boyutlu veriler olması RNN mekanizmasını yüksek bir hesaplama yükü altında bırakmaktadır. Bu hesaplama yükünün üstesinden, gelişkin GPU mimarisi ve paralelleştirilmiş algoritmalar ile gelmenin önünde ise RNN mimarisinin sahip olduğu seri işleme bağımlılıkları çözülmek üzere durmaktadır. Bu çalışmamız ile yine doğadan ilham aldığımız bir bakış açısı ile RNN mimarisindeki bağımlılıklarını azaltarak verimli bir paralel işleyiş önermekteyiz.
Metal-organic frameworks (MOFs) can be utilized in various engineering applications as nanoporous materials, including catalysts, biotechnology, controlled drug release, gas separation, and sensors. Recent experimental studies have demonstrated that controlled and reversible structural changes occur in MOFs under the influence of externally applied stimuli. While classical molecular dynamics simulations have been commonly used to model MOFs, potential deformations under external stimuli may not be well captured with classical force field parameters. In this work, we have constructed machine learning potentials for MOFs and compared predicted energies and forces with counterparts calculated using electronic structure methods. We obtained significantly low root mean square errors, implying that MOF energies and forces can be accurately predicted using machine learning potentials, thereby opening the door for quantum-accurate modeling of MOFs in a shorter time.
This project has received funding from the European Union’s Horizon 2021-2027 research and innovation program under the Marie Skłodowska-Curie grant agreement No. 101063496.
Çalışma grubu, Hesaplamalı Akışkanlar Dinamiği (HAD) alanında çalışan akademi ve endüstriden katılımcıların çalışmalarını, yaklaşımlarını, eğitim ve YBH ihtiyaçlarını ve aralarındaki işbirliği potansiyelini tartışmalarını amaçlamaktadır.
Karmaşık akış problemlerinin HAD simülasyonları ile çözümü YBH sistemlerinde paralel hesaplamalar gerektirmektedir. Farklı türbülans modelleme yaklaşımları ile Navier-Stokes denklemlerinin çözümüne dayalı veya Lattice Boltzmann Metotlarına dayalı HAD simülasyonları için kullanılan üniversitelerde geliştirilen özgün HAD yazılımları, OpenFOAM, SU2, Code_Saturne, OpenLB gibi açık kaynaklı HAD yazılımları ve ayrıca ticari HAD yazılımları bulunmaktadır. Günümüzde, havacılık ve uzay, otomotiv, enerji gibi farklı alanlarda birçok farklı akış probleminin çözümü ve uçak, motor, rüzgâr türbini gibi karmaşık mühendislik sistemlerinin tasarım ve optimizasyonunda HAD kullanımı oldukça önemli bir yer teşkil etmektedir ve endüstride de yaygın kullanılmaktadır.
HAD simülasyonları ve analizleri, YBH kullanımı, türbülans modelleme ve sayısal yöntemler, programlama ve kod geliştirme kabiliyetleri, eğitim ihtiyaçları, açık kaynaklı HAD yazılımları, ön ve art-işlem araçları ve yöntemleri gibi konular çalışma grubu kapsamında yer alması planlanmaktadır.
Çalışma grubu HAD alanında farklı problemler üzerinde çalışan akademi ve endüstriden katılımcılardan oluşacaktır.
Program ve Sunumlar:
Akademi
1. 14:00 Ali Karakuş, ODTÜ, libParanumal: A library for exascale CFD
2. 14:05 Mete Köken, ODTÜ, CFD Applications in Civil Engineering
3. 14:10 Metin Muradoğlu, Koç Üniv., Direct numerical simulation of bubble-induced elasto-inertial turbulence (EIT)
4. 14:15 Özlem Yalçın, Istanbul Gelişim Üniv., Doğal Taşınım Problemlerinin Lattice Boltzman Metodu İle Çözümü
Endüstri
5. 14:20 Şahin Yiğit, TUSAŞ, TUSAŞ´ta yapılan açık kaynak CFD Uygulamaları (TAMS-AERO HAD Yazılımı)
6. 14:25 Osman Güngör, TUSAŞ, Helikopter Tasarım Süreçlerinde HAD Uygulamaları
7. 14:30 Atakan Atay, Melih Aksoy, Arda Doğancı, İlhan Görgülü, ROKETSAN, Uzay Sistemlerinde Hesaplamalı Akışkanlar Dinamiği Analizleri
8. 14:35 Hasret Türkeri, TEI, LES simulations of turbulent spray combustion on aero-engine combustion chambers using OpenFOAM.
Akademi
9. 14:40 Sıtkı Uslu, TEDU, Hesaplamalı Akışkanlar Dinamiği Kullanılarak Bir Turbojet Motorda 6. Yanma Odasının Yüksek İrtifa Koşullarında Yeniden Tutuşma Karakteristiklerinin Belirlenmesi
10. 14:45 Hasan U. Akay, Atılım Üniv., TÜBİTAK-HPC Olanakları Kullanılarak Açık Kaynak Yazılımlarla Yürütülen
Araştırmalar
11. 14:50 Ruhşen Çete, THKU, Yapısal – Yapısal olmayan çözüm ağları ile hızlı kapalı çevrim yeni bir çözüm algoritması; Alternatif Hücre Yönleri Kapalı (AHYK) Metodu. / New Novel Fast Implicit Method for Structured or Unstructured Meshes; Alternating Cell Direction Implicit (ACDI) Metod.
12. 14:55 Sinan Eyi, ODTÜ, Hesaplamalı Akışkanlar Dinamiği Çalışmaları
Endüstri/Akademi
13. 15:00 Bertan Özkan, Mehmet Emin Çelikkıran, Ozan Köken, Mustafa Akdemir, Roketsan, Hesaplamalı Akışkanlar Dinamiği Çalışmaları
14. 15:05 Göktuğ Koçak, TUSAŞ, Fizik Temelli Çözüm Ağlarının Kapalı Çevrim Olarak Yaratımı ve Tasarım Modülü ile Test Edilmesi
15. 15:10 Mehmet Şahin, İTÜ, A Monolithic Nonlinear Newton Method for the Compressible Reynolds Averaged Navier-Stokes Equations
16. 15:15 Yusuf Özyörük, ODTÜ, Hesaplamalı Akışkanlar Dinamiği Çalışmaları
17. 15:20 Özgür Ertunç, Özyeğin Univ., HAD ve Fizik Bilgili Sinir Ağlarının Birlikte Kullanımı: Örnek Fırsatlar
15:25-15:40 Panel/Tartışma
A key challenge faced in client-server systems that heavily rely on data is the fast delivery of data to end-users. To address this difficulty, this study presents a novel approach for modeling and forecasting user navigational browsing behavior, to establish an efficient prefetching mechanism. Regarding the approach for representing page visit data, we employ the word2vec embedding technique to encode each user's page visit as a numerical vector. Regarding the encoding of browsing activity data, we utilize aggregation on the embedding vectors. These vectors correspond to page visits occurring sequentially and are used to describe each user's browsing behavior using a numerical vector. In the proposed method, machine learning algorithms are employed to analyze and model the browsing behavior of all users. Machine learning models are employed to forecast the next user action during the navigation of data-intensive web and mobile application web pages. Subsequently, we employ this forecast to establish an intelligent prefetching method, which provides the capability of acquiring predicted web page data in proxy servers before it is requested. An experimental study was conducted using an open-source dataset derived from a mobile application used in a coffee shop. The purpose of this experimental study was to examine the efficacy of the proposed approach. The findings of the empirical investigation suggest that the proposed method has the potential to provide an efficient prefetching methodology, hence enhancing the efficiency of data-intensive client-server-based systems.
This paper introduces a machine learning-based solution for efficiently solving sparse linear systems, a prevalent issue in scientific and engineering domains. The proposed approach leverages machine learning to predict the optimal number of partitions required for the block Cimmino method, a parallel hybrid solver to solve these systems. Traditional trial-and-error methods for determining the best number of partitions are surpassed by the proposed machine learning model, which is trained and validated on a diverse dataset from the Suite Sparse Matrix Collection. The model's performance is enhanced through feature selection and the use of Principal Component Analysis (PCA) for dimensionality reduction during training. The optimal model is selected based on the validation score and is evaluated using accuracy, AUC, and F1-Score metrics for both the training and testing phases. This method offers a faster and more efficient alternative to traditional approaches, with potential applications in various numerical methods in science and engineering. The study underscores the importance of appropriate feature selection for training the model and suggests future work to broaden the dataset and investigate other machine learning models to further improve the accuracy and efficiency of the proposed solution.
Yapılan çalışmada işitme engelli insanlar için iletişim kolaylığı sağlama amaçlı; konvolüsyonel sinir ağları ve uzun kısa süreli bellek kullanılarak, derin öğrenme teknikleri yardımıyla video ile işaret dilinden Türkçe kelimelere sınıflandırma yapılması hedeflenmiştir.
Çalışma; AUTSL veri seti ile gerçekleştirilmiştir. Veri setinde; zamirler, aile bireyleri, yiyecekler, nesneler, haftanın günleri gibi günlük hayatta kullanılan 226 kelimenin işaretini barındıran 35000’den fazla renkli video bulunmaktadır. Farklı uzunluktaki videolar ön işlemden geçirilerek sabit uzunluğa ve normalize edilmiş duruma getirilmiştir. Özellik çıkarımı için ön eğitimli MobileNetV2 ağı ve yeterli doğruluk oranına ulaşılamadığı için Mediapipe tarafından geliştirilen Hand Landmarks Detection yapısı ile iki farklı seçenek kullanılmıştır. Özellik çıkarımı videodaki tüm kareler için tekrarlanarak Kare Sayısı x Özellik Vektörü şekline getirilmiştir. Daha sonrasında; birbirine bağlı veriler işlenmesi için çift yönlü uzun-kısa süreli bellek yapısı, videolardaki önemli karelerin etkisini gözetmek için oluşturulan geçici dikkat yapısı, ezberlemeyi önlemek için seyreltme katmanı ve sınıflandırma için tam bağlantılı katman kullanılmıştır. 226 kelimeye karşılık indeksleri çıkış olarak kullanan softmax sınıflandırıcı ile ağ oluşturulmuştur.
Yapılan testlerde doğruluk değerleri; özellik çıkarımı için MobileNetV2 kullanılan ağda %20’yi aşamamışken Mediapipe çözümüyle özellik çıkarılan ağda %83’e ulaşmıştır. Test işlemleri için Tkinter aracı kullanılarak grafiksel arayüz oluşturulmuştur.
Günümüzde HPC+ olarak bilinen, Yüksek Başarımlı Hesaplama, Yüksek Başarımlı Veri Analitiği, Yapay Zeka yakınmasında YBH sistemlerinin kullanımı, ilgili komunitelerin ihtiyaçları ve çözüm önerilerinin belirtildiği, panelistlerin katılımcılar içerisinden de değişiklik gösterebileceği ("fishbowl conversation") açık bir tartışma ortamı olarak planlanmıştır.
Orta Doğu Teknik Üniversitesi Kültür Kongre Merkezi