Interessanter Artikel, in dem beschrieben wird, mit welchen Techniken ein großes Sprachmodell auf eine handhabbare Größe gebracht werden kann. https://www.heise.de/hintergrund/Wie-man-riesige-Sprachmodelle-auf-praxistaugliche-Masse-schrumpft-10286307.html?seite=all

LLM schrumpfen

11. März 2025 0

Es scheint mir so, als ob DeepSeek etwas übereilt auf den Markt gebracht wurde. Vielleicht war das politische Signal, was gesendet werden sollte, wichtiger als die Sicherheit. https://www.golem.de/news/sicherheit-deepseek-r1-wohl-fuer-so-ziemlich-jeden-ki-jailbreak-anfaellig-2502-192992.html

DeepSeek anfällig für Jailbreaks

4. Februar 2025 0

Interssante Analyse von Marcel Weiß über die Auswirkungen vom Erfolg von Deepseek auf die Tech-Branche. Er sieht die Auswirungen durchaus differenziert. https://mastodon.social/@marcelweiss/113910803746426005

Analyse zu den Auswirkungen von DeepSeek

30. Januar 2025 0

Kaum da und schon wieder weg, jedenfalls in den italienischen App Stores für iOS und Android. Der Grund sind Probleme mit dem Datenschutz. https://stadt-bremerhaven.de/ki-app-deepseek-verschwindet-nach-datenschutzanfrage-aus-italienischen-app-stores/

DeepSeek

29. Januar 2025 0

Hier nochmal eine schöne Einordnung des Erfolgs von Deepseek bei Heise Online: https://www.heise.de/hintergrund/Warum-Deepseek-R1-nicht-das-Ende-von-OpenAI-und-Meta-bedeutet-10260257.html

Einordnung DeepSeek

29. Januar 2025 0

DeepSeek R1

Vor ein paar Tagen wurde ein neues Transformer-Modell veröffentlich und die Börsenkurse der Tech-Unternehmen gehen auf Talfahrt. Wie passt das zusammen? Deepseek ist ein Sprachmodell ähnlich wie ChatGPT. Die Ergebnisse, die Deepseek liefert, sind mit denen von ChatGPT vergleichbar. Es gibt jedoch einen gewaltigen Unterschied im Hintergrund. Während OpenAI und die anderen Anbieter von großen... Continue Reading →

29. Januar 2025 0

Bloggen auf WordPress.com.

Nach oben ↑

Erstelle eine Website wie diese mit WordPress.com

Jetzt starten