Vor ein paar Tagen wurde ein neues Transformer-Modell veröffentlich und die Börsenkurse der Tech-Unternehmen gehen auf Talfahrt. Wie passt das zusammen?
Deepseek ist ein Sprachmodell ähnlich wie ChatGPT. Die Ergebnisse, die Deepseek liefert, sind mit denen von ChatGPT vergleichbar. Es gibt jedoch einen gewaltigen Unterschied im Hintergrund. Während OpenAI und die anderen Anbieter von großen Sprachmodellen auf die Skalierung der herkömmlichen Technik setzen, hat Deepseek an der Effizienz-Schraube gedreht. OpenAI nutzt immer größere Rechenzentren und steigert die Kosten ins Unermessliche. Das Geld, das für Deepseek investiert wurde ist um einige Größenordnungen geringer also beispielsweise für GPT 4.
Deepseek kommt aus China. Durch die U.S. amerikanischen Sanktionen steht dort nicht die aktuellste Hardware zur Verfügung, insbesondere die aktuellen Nvidea Beschleunigerkarten für AI. Deswegen hatte Deepseek keine andere Wahl, als sein Modell effizienter zu machen. Das ist auch gut gelungen.
Eherlich gesagt, überrascht mich das nicht sehr. Dass im Hintergrund schon eine ganze Weile intensiv an effizienteren Modellen geforscht wurde, hat wohl jeder mitbekommen, der ein wenig in die Materie eingetaucht ist. Das ist auch ganz logisch. Den enormen Kosten für die Erstellung der Modelle stehen bei den meisten Konzernen nur überschaubare Einnahmen durch die generative KI gegenüber. Hier sehe ich das viel größere Problem am akuellen KI-Hype. Irgendwann ist das Risikokapital aufgebaucht und es müssen tragfähige Geschäftsmodelle her. Wenn das nicht gelingt, dann wird der generativen KI das gleiche Schicksal wie die Blockchain-Technologie drohen.
Hinterlasse einen Kommentar