python

ChatTTSを使って音声合成をDockerで試す

hugging faceで注目を浴びているChattTTSというtext2voiceのモデルを使ってみました。また、dockerで構築したので誰でも再現可能です。現時点では日本語の音声は生成できませんでした。

Yoloを使って株価チャートの予測(?)をしてみる

株価の予測にYoloを使ったモデルを見つけたので、試してみました。元の文献と同じような結果が得られました。また、Dockerを使って環境構築したので誰でも同じような再現が可能です。

ローカルで動くMiniCPM-V-2.5というマルチモーダルLLMを動かしてみた(llama.cpp)

ローカルで動くマルチモーダルLLM、「MiniCPM-V-2.5」を試してみました。どのような解像度の画像であっても、縮小せずにLLMに特徴量をとることができることが利点のマルチモーダルLLMです。また、llama.cppを利用することで、多くの環境で利用できることを確かめました。

llamafile(llama.cpp)で返答をjsonフォーマットに固定する

llamafileを使ったローカルLLMで、返答をjsonのフォーマットに固定する方法を記事にしました。この方法はllama.cppにも同様に使えるため、llama.cppから派生したフレームワークでは一般的に使えると思います。

ComfyUIをリモートのDockerで動かして、動画を生成する

ComfyUIをDockerでリモートに立てて、それをローカルネット内から接続する方法を書きました。また、animateDiff-lightingを使い簡単に動画が作れることを確かめました。

Text2VideoをDockerで動かしたい[AnimateDiff-lighting / diffusers]

pythonのdiffusersをつかってtext2VideoのモデルであるanimateDiff-lightningを動かしてみました。また、Dockerで環境構築したので、誰でも再現可能です。

次のページ

1 2 3 4 … 15