Digitale Degustation
Am 20.08.2024 fand in der Handwerkskammer Magdeburg die sog. Digitale Degustationdes Mittelstand-Digital Zentrums Magdeburg statt. Bei kühlem Cascara und süßen Speisen von regionalen Anbietern wurden KI-Tools vorgestellt und diskutiert sowie Erfahrungen von Magdeburger Unternehmen mit KI ausgetauscht. Mit dabei war Frau Juliane Höbel-Müller, die das Anwendungspotential embedding-basierter Visualisierungen für die Exploration und Re-Organisation einer großen Luftbildsammlung des Fotografen Steffen Lehmann demonstrierte.
Die online verfügbare Luftbilddatenvisualisierung ist unter https://atlas.nomic.ai/data/rabotlia/foto-video-lehmann-atlas-2 zu finden. Sie basiert auf dem vortrainierten Vision-Embedding-Modell nomic-embed-vision-v1.5, das mehr als 90 Mio. Parameter aufweist. Das Training dieses Modells wurde von Nussbaum et al. (2024) in ihrem technischen Bericht Nomic Embed Vision: Expanding the Latent Space skizziert. Bemerkenswert ist, dass es denselben latenten Raum wie nomic-embed-text-v1.5 nutzt. Dies ermöglicht Text-zu-Bild- und Bild-zu-Text-Suchen durch Berechnung der Cosinus-Ähnlichkeit von Paaren normalisierter Embeddings, wie der exemplarische Python-Code unter https://huggingface.co/nomic-ai/nomic-embed-vision-v1.5 veranschaulicht (siehe torch.matmul(img_embeddings, text_embeddings.T)
).