いろんなAIを調べてみる

　近年では、AI市場が目まぐるしく動き、どの会社がなんのAIを開発しているのかよくわからない。OpenAIやMicrosoft、Google、Metaといった名の知れた企業であればわかりやすいが、Stability AIなど普段聞き覚えのない企業に関しての情報が著しく欠如してしまう。同時に、日々発展し続けているため、最新情報を追うのもまた困難である。AIを知るということも大切だが、実際に業務で使えるようなAI、例えばプレゼン資料を作るAIや統計データを簡単に集めて視覚的に優れた表にまとめてくれるAIなどを知り、利便性や効率性を向上させる意識も必要である。知識は常にアップデートしなければならず、同時に知識を技術へ昇華せなければならない。このような漸進的な取り組みはやりがいがあって面白い。

Sora

先日OpenAIが発表した生成AI。実用化はまだされていないが、既存の映像生成AIの性能とは一線を画し、高性能な反面様々な問題があると言われている。著作物の権利、クリエイターとの問題、表現の問題、フェイク動画など

youtu.be

動画の中間で「real」が48%という結果になっている。

チャットボットAI

ハルシネーションや回答の差異を理解する。

Chat gpt [OpenAI] ※MicrosoftはCopilotなどがある

Gemini [Google]　など

画像生成AI

画像生成AIは有料なものが多く実際に試しにくい。

DALL-E [OpenAI]

Stable Diffusion [Stability AI]　など

音楽生成AI

今まで調べたことのないジャンルだったが、OpenAIもすでに開発していた。

JukeBox [OpenAI]

Suno [Suno]　など

他にもいろんな種類の生成AIがあるだろうが、この３つがあれば大体なんでもできそうな気がしてしまう。機能が統合された環境があれば利便性や効率性はますます向上するだろう。Chat gpt gpt-4はDALL-Eと連携し、画像を読み取って理解することができる。これだけでもかなり画期的である。情報収集により一層取り組み、時代に取り残されないようにしなければならない。

Timely

カレンダー、スケジュール管理

Gamma AI　（一部無料）

プロンプトを投げるだけで資料が完成する

tl;dv　(一部無料)

Zoomなどの議事録を作成する。notionやSlackに転送できる。chat gptに丸投げして要点整理もできる

Chat with any PDF

PDFを貼ると、そのPDFを参照して、こちらからの質問に答える。長文などの要点を抽出したい時に楽。

Whisper

音声を抽出する。会話をテキスト化する。使うにはシステム構築の知識が必要。