Interessanter Artikel, in dem beschrieben wird, mit welchen Techniken ein großes Sprachmodell auf eine handhabbare Größe gebracht werden kann. https://www.heise.de/hintergrund/Wie-man-riesige-Sprachmodelle-auf-praxistaugliche-Masse-schrumpft-10286307.html?seite=all
Es scheint mir so, als ob DeepSeek etwas übereilt auf den Markt gebracht wurde. Vielleicht war das politische Signal, was gesendet werden sollte, wichtiger als die Sicherheit. https://www.golem.de/news/sicherheit-deepseek-r1-wohl-fuer-so-ziemlich-jeden-ki-jailbreak-anfaellig-2502-192992.html
DeepSeek anfällig für Jailbreaks
Interssante Analyse von Marcel Weiß über die Auswirkungen vom Erfolg von Deepseek auf die Tech-Branche. Er sieht die Auswirungen durchaus differenziert. https://mastodon.social/@marcelweiss/113910803746426005
Analyse zu den Auswirkungen von DeepSeek
Kaum da und schon wieder weg, jedenfalls in den italienischen App Stores für iOS und Android. Der Grund sind Probleme mit dem Datenschutz. https://stadt-bremerhaven.de/ki-app-deepseek-verschwindet-nach-datenschutzanfrage-aus-italienischen-app-stores/
DeepSeek
Hier nochmal eine schöne Einordnung des Erfolgs von Deepseek bei Heise Online: https://www.heise.de/hintergrund/Warum-Deepseek-R1-nicht-das-Ende-von-OpenAI-und-Meta-bedeutet-10260257.html
Einordnung DeepSeek
DeepSeek R1
Vor ein paar Tagen wurde ein neues Transformer-Modell veröffentlich und die Börsenkurse der Tech-Unternehmen gehen auf Talfahrt. Wie passt das zusammen? Deepseek ist ein Sprachmodell ähnlich wie ChatGPT. Die Ergebnisse, die Deepseek liefert, sind mit denen von ChatGPT vergleichbar. Es gibt jedoch einen gewaltigen Unterschied im Hintergrund. Während OpenAI und die anderen Anbieter von großen... Continue Reading →