Thema der heutigen Folge
Wenn Unternehmen heute ein großes Sprachmodell wie ChatGPT produktiv einsetzen wollen, gibt es eine Reihe von Herausforderungen, die gelöst werden müssen, um zuverlässige, vertrauenswürdige, sichere und gesetzeskonforme Ergebnisse zu erzielen.
Ein großer Bereich, in dem derzeit geforscht und gearbeitet wird, ist die Richtigkeit und Sicherheit der Daten, insbesondere die folgenden drei Punkte: Halluzinationen, Datentrennung und Datenschutz.
Einer der vielversprechendsten Lösungsansätze ist die sogenannte Retrieval Augmented Generation (RAG), die verspricht, die aktuellen Probleme der LLMs kostengünstig und zuverlässig zu lösen.
Im ersten Teil des Interviews mit Sam Nündel geht es darum, mit welchen Problemen insbesondere kleine und mittelständische Unternehmen derzeit konfrontiert sind, wenn sie ein Large Language Model einsetzen wollen und welche Lösungsansätze vor Retrieval Augmented Generation schon verfolgt wurden.
Hinweis: Zum Zeitpunkt der Aufnahme, habe ich das Interview mit meiner Kollegin Tanja Nündel geführt. Meine Kollegin Tanja ist inzwischen mein Kollege Sam. Den Titel der Folge und das Titelbild haben wir schon mit Sams neuen Namen versehen, nur die Folge selbst können wir leider nicht so leicht im Nachhinein ändern. Deswegen spreche ich Sam in dieser Folge noch mit seinem alten Namen an.
Heute zu Gast
Sam Nündel ist Experte auf dem Gebiet der KI-gestützten Langtext- und Dokumentenanalyse sowie der KI-gestützten Suche und arbeitet seit über drei Jahren bei assono.
Shownotes
In „Chatbots und KI“ diskutiert Thomas Bahn mit interessanten Gästen aus Wirtschaft und Wissenschaft über Nutzen, Anwendungen und Erfahrungen aus den Bereichen Chatbots und Künstliche Intelligenz.
Zeitstempel:
00:00:00 Intro
00:02:31 Vorstellung von Sam Nündel
00:05:31 Welche Probleme gibt es bei der Nutzung von LLMs für KMU?
00:08:22 Halluzinationsproblem
00:10:06 Nachgelagerte Kontrolle der Ausgaben
00:12:48 Vorgelagerte Lösungsansätze
00:15:06 Feintuning eines LLM
00:18:46 Prompt Engineering und seine Grenzen
00:20:53 Retrieval Augmented Generation
00:24:02 Outro
Weitere Informationen:
Oliver Schonschek, Aug 2023
Lässt sich ChatGPT datenschutzgerecht nutzen?
Najeeb Nabwani, Sept 2023
Full Fine-Tuning, PEFT, Prompt Engineering, and RAG: Which One Is Right for You
Cobus Greyling, Jan 2024
Large Language Model Hallucination Mitigation Techniques
Patrick Lewis et al.
Retrieval-Augmented Generation for Knowledge-Intensive NLP Task
Siqing Huo et al., 2023
Retrieving Supporting Evidence for LLMs Generated Answers (preprint)
Cobus Greyling, Oct 2023
Emerging RAG & Prompt Engineering Architectures for LLMs
Oded Ovadia et al.
Fine-Tuning or Retrieval? Comparing Knowledge Injection in LLMs (preprint)
Host:
Thomas Bahn ist Geschäftsführer, Mitgründer und Gesellschafter der assono GmbH. Seit mehr als 20 Jahren berät er erfolgreich Unternehmen aus ganz Deutschland rund um das Thema Software und Digitalisierung.
Produktion:
Johannes Göttsch ist Mediengestalter und Conversational Designer bei der assono GmbH.
Bei Fragen oder Anmerkungen freuen wir uns auf Ihre Nachricht an podcast@assono.de
Der Podcast wird präsentiert von assono - Wir entwickeln Chatbots, mit denen sich Menschen gerne unterhalten.
Ein Chatbot ist genau das Richtige für Ihr Unternehmen und Sie wollen mehr darüber erfahren? Gerne beraten wir Sie in einem kostenlosen Erstgespräch zu Ihrem Anwendungsfall. Vereinbaren Sie dazu einen Termin auf unserer Webseite oder rufen Sie uns an unter +49 4307 900 408. Alternativ können Sie auch einen Termin über unseren KI-Chatbot "asski" vereinbaren. Wir freuen uns auf Sie!