記事

記事

ChatTTSを使って音声合成をDockerで試す

hugging faceで注目を浴びているChattTTSというtext2voiceのモデルを使ってみました。また、dockerで構築したので誰でも再現可能です。現時点では日本語の音声は生成できませんでした。
記事

Yoloを使って株価チャートの予測(?)をしてみる

株価の予測にYoloを使ったモデルを見つけたので、試してみました。元の文献と同じような結果が得られました。また、Dockerを使って環境構築したので誰でも同じような再現が可能です。
記事

NotebookLMを使って英語資料を理解する

GoogleのNotebookLMを実際に使ってみました。簡単に英語資料をアップロードできて、日本語で資料の解説をしてくれました。また、資料に載っていないことは答えないことも確認できました。
記事

ローカルで動くMiniCPM-V-2.5というマルチモーダルLLMを動かしてみた(llama.cpp)

ローカルで動くマルチモーダルLLM、「MiniCPM-V-2.5」を試してみました。どのような解像度の画像であっても、縮小せずにLLMに特徴量をとることができることが利点のマルチモーダルLLMです。また、llama.cppを利用することで、多くの環境で利用できることを確かめました。
記事

llamafile(llama.cpp)で返答をjsonフォーマットに固定する

llamafileを使ったローカルLLMで、返答をjsonのフォーマットに固定する方法を記事にしました。この方法はllama.cppにも同様に使えるため、llama.cppから派生したフレームワークでは一般的に使えると思います。
記事

ComfyUIをリモートのDockerで動かして、動画を生成する

ComfyUIをDockerでリモートに立てて、それをローカルネット内から接続する方法を書きました。また、animateDiff-lightingを使い簡単に動画が作れることを確かめました。