Veröffentlicht am: https://blog.crossasia.org/hackathon-layouterkennung/
Am 22. November findet in Dresden ein Hackathon statt – und CrossAsia ist dabei! Gemeinsamen mit Experten von Silicon Saxony und dem KI Netzwerk Dresden arbeiten wir an einer KI-basierten Layouterkennung für tibetische Handschriften und Blockdrucke. Es werden dabei leistungsstarke Modelle wie YOLO, SAM2 und GroundingDino zur automatischen Erkennung von Layouts und hier auch Illustrationen sowie Textinhalten benutzt. Im nächsten Schritt können Open-Source-Language-Models wie LLaMA 3.1 oder APIs (z.B. ChatGPT) eingesetzt werden, um die gesammelten Daten zu analysieren und Zusammenhänge zwischen Texten und Bildern zu erschließen. So können Lösungen für den automatischen Vergleich von Textinhalten in historischen Dokumenten und deren…