
Large Language Model-Based Solutions: How to Deliver Value with Cost-Effective Generative AI Applications
Lernen Sie, kosteneffiziente Anwendungen mit großen Sprachmodellen zu erstellen
In Large Language Model-Based Solutions: How to Deliver Value with Cost-Effective Generative AI Applications" liefert Shreyas Subramanian, Principal Data Scientist bei Amazon Web Services, einen praktischen Leitfaden für Entwickler und Datenwissenschaftler, die kosteneffiziente Large Language Model (LLM)-basierte Lösungen erstellen und bereitstellen möchten. Das Buch behandelt eine breite Palette von Schlüsselthemen, darunter die Auswahl eines Modells, die Vor- und Nachbearbeitung von Daten, das Prompt Engineering und die Feinabstimmung von Anweisungen.
Der Autor beleuchtet Techniken zur Optimierung der Inferenz, wie Modellquantisierung und Pruning, sowie verschiedene und erschwingliche Architekturen für typische generative KI-Anwendungen (GenAI), einschließlich Suchsysteme, Agentenassistenten und autonome Agenten. Sie finden außerdem:
⬤ Effektive Strategien zur Bewältigung der Herausforderung der hohen Rechenkosten, die mit LLMs verbunden sind.
⬤ Unterstützung bei der Erstellung und dem Einsatz von erschwinglichen generativen KI-Anwendungen, einschließlich Tuning- und Inferenztechniken.
⬤ Auswahlkriterien für die Wahl eines Modells, mit besonderer Berücksichtigung von kompakten, flinken und domänenspezifischen Modellen.
Das Buch eignet sich perfekt für Entwickler und Datenwissenschaftler, die an der Einführung grundlegender Modelle interessiert sind, oder für Unternehmensleiter, die ihre Nutzung von GenAI ausweiten wollen. Large Language Model-Based Solutions ist auch für Projektleiter und -manager, Mitarbeiter des technischen Supports und Administratoren, die sich für dieses Thema interessieren, von Nutzen.