# A.3 (Optional): Anbindung an ChatGPT

Generative Modelle sind besonders im letzten Jahr verstärkt in den Fokus der Öffenlichkeit geraten. Zum einen Diffusion Modelle wie Dall-E oder Stable Diffusion, die zur textbasierten Generierung von Bildern genutzt werden können. Zum anderen dann besonders auch durch ChatGPT als (anfangs) sprachbasierter ChatBot. 

ChatGPT {cite}`chatgpt2022` basiert auf einem Sprachmodell: den Generative Pre-trained Transformer. Dies sind eine Gruppe von generativen Modellen, die in der Sprachverarbeitung seit einigen Jahren Anwendung finden und hier sehr gute Ergebnisse zum Beispiel als Übersetzer liefern. Ein entscheidender Mechanismus von Transformer-Architekturen (wie sie in GPT Modellen und allen ähnlichen Ansätzen wie Bard, Llama etc. genutzt werden) ist die Idee der Self-Attention {cite}`vaswani2017attention`. Grundsätzlich addressiert dieser Mechanismus das von uns in n-gram Modellen beobachtete Problem, dass inhaltliche und semantische Beziehungen nicht darstellbar sind sondern lediglich Nachbarschaften betrachtet werden. In Self-Attention Modellen werden einzelne Inputs (Wörter) nicht nur inhaltlich kodiert, sondern (parallel) werden Beziehungen zwischen diesen gelernt -- auch über längere Textabschnitte hinweg (für eine detailierte Erklärung mit guter Visualisierung siehe {cite}`alammar2018transformer` und für GPT-3 {cite}`alammar2020gpt3`). Dies erlaubt eine Einbeziehung des Kontextes (in einem gewissen Maße zumindest; in GPT-4 ist dieser Kontext z.B. deutlich erweitert worden).

Eine Schwäche dieser Modelle ist, dass sie zwar gut lernen, was auf einer oberflächlichen Ebene als Sprache durchgehen würde. Aber das sie dabei dann gerade auch Inhalte "generieren" oder halluzinieren:

> Generative models have uneven capability surfaces, with the potential for surprisingly strong and surprisingly weak areas of capability. *(OpenAI Statement on their generative model page, https://platform.openai.com/docs/model-index-for-researchers)*

In der Entwicklung von ChatGPT {cite}`chatgpt2022` ist OpenAI hier eine bedeutende und extrem effektive Methode gelungen, diese generativen Modelle durch ein Nachtraining einzuengen und so deutlich zu beschränken (wobei es hier weiterhin noch Lücken und Schwächen gibt). Grundlage dieser Methode ist ein trainieren eines vorhersagenden Modells über Reinforcement Learning, bei dem Feedback von menschlichen Nutzern mit einbezogen wird. Während ein solches Feedback üblicherweise nicht möglich ist, da für ein Training sehr große Datenmengen genutzt werden, so hat OpenAI in ihrem Ansatz hier ein zusätzliches Modell trainiert, was die Einschätzungen der Nutzer widergibt. Dies Modell kann dabei viel einfacher sein und viel schneller trainiert werden, wodurch nur wenig echte Nutzerdaten notwendig werden (für mehr Details siehe die Veröffentlichung zum Vorgängermodell InstructGPT {cite}`ouyang2022training`). 

```{figure} images/ChatGPT_Diagram.svg
---
width: 100%
---

ChatGPT ist ein nachjustiertes GPT-3.5 Modell, was über menschliches Feedback nachtrainiert wurde (Fig. und weitere Erklärungen {cite}`chatgpt2022`).
```

## Ziel von Teilaufgabe A.3

Aufgabe A.3 ist optional.

Ziel der Aufgabe ist die Anbindung an ChatGPT. Dabei wird das Nutzen einer offenen (Header-basierten) API gelernt. Der bisherige Chatbot kann so erweitert werden durch die direkte Anbindung über die OpenAI-API an die vers. GPT-Modelle und so Anfragen an diese in der Dialogschleife umgesetzt werden.

## Grundlegende Struktur 

In dieser optionalen Aufgabe soll ihnen nur rudimentär die Anbindung vorgestellt werden (Anfrage und Rückgabe). Machen sie sich selbst vertraut mit der API. Die OpenAI API erlaubt Zugriffe über HTTP requests und stellt diese für Python zur Verfügung. Für C++ gibt es eine rein [Header-basierte Anbindung](https://github.com/olrea/openai-cpp), die wir hier nutzen können.

```{admonition} Anweisungen2
* Machen sie sich mit der [API](https://github.com/olrea/openai-cpp) einmal vertraut.
* Sie müssen dann vor der Ausführung ihre OPENAI_API_KEY als Umgebungsvariable setzen (oder im Programm direkt). Hierzu müssen sie sich bei OpenAI anmelden und dann einen [API_KEY erzeugen](https://platform.openai.com/account/api-keys). Im Kurs wird auch ein Burner-Key vergeben (gültig nur bis Freitag, 31.6.2024, in ihrer Shell as Variable setzen: `export OPENAI_API_KEY='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' `). 
* Unten sehen sie im Code eine minimale Anbindung. Leiten sie hier ihre Anfrage weiter. 
* Als Erweiterung: Im Gegensatz zu ChatGPT ist hier jeder Call eine neue Anfrage. Um einen Dialog zu führen, müssen sie die history immer mit übergeben als Teil ihres Promptes. Dazu können sie ihrem ChatBot auch eine Persönlichkeit geben oder vor-prompten. 
* Überlegen sie, wie sie diese History effizienter und kompakter gestalten können.
```

`````{tab-set}
````{tab-item} chatgpt_bot.cpp
```{literalinclude} A_chatngram/src/chatgpt_bot.cpp
:language: c++
```
````
````{tab-item} Makefile
```{literalinclude} A_chatngram/Makefile_openai
:language: makefile
```
`````

```{admonition} Tipp - hier öffnen
:class: tip, dropdown

Die Anfrage wird als JSON Objekt generiert (`openai::Json query;`), dies können sie anpassen (z.B. `query["model"] = "gpt-3.5-turbo";` ). Siehe auch [nlohman Website](https://github.com/nlohmann/json).

Für den komplexen Eintrag der Nachricht (messages) an sich müssen sie ein array erzeugen:
`query["messages"] =  openai::Json::array({
    {{"role", "user"}, {"content", userInput}}
});`

```

## Mögliche Erweiterungen

* Prompt-Engineering -- Bot mit spezieller Persönlichkeit versehen.
* Anpassung auf neue GPT-4 API oder GPT-4o.
* Für ein angepassteres neueres GPT-3.5 Modell können sie folgenden Code nutzen:
* Wenn sie lokal ein LLM laufen lassen wollen, können sie auf eine Variante des Llama Modells (von Meta) zurückgreifen, z.B. Alpaca {cite}`touvron2023llama,alpaca` bietet eine fine-tuned Version an, die nur wenig Hardware-Voraussetzungen einfordert. Die Anbindung hierfür finden sie unter [https://github.com/ggerganov/llama.cpp](https://github.com/ggerganov/llama.cpp).

## Referenzen

```{bibliography}
:filter: docname in docnames
:style: plain
```