ChatGPT

生成AIキャッチアップ(ChatGPT Plus編)

データアナリティクス部の庄内です。

GTC基調講演、観ましたか?マルチダイ時代へ突入ですね・・・
今月だけでもAnthropic社がChatGPT超えのClaude3を発表したり、イーロン・マスク氏率いるxAIもLLM「Grok-1」github に公開する(月曜日)など、巷は生成AIの話題で持ち切りです。
しかし、世の中にはこの流れと無縁な人も結構いるようで、最近同年代の方々と話してもほとんど使っていないとか1年前に使ったきりとかで全く活用していないみたいで悲しくなります。
そんなおじさんを救いたい!そんなモチベーションでこの記事を書いてみました。
※一線を越えてもらうことが目的なので、スゴ技とかは出てきません(アシカラズ)

続きを読む

未来を切り開くマルチモーダルAI:GPT-4VとVideo-LLaVAによる動画解析

データアナリティクス部の入澤です。
2022年以来、ChatGPTをはじめとするいわゆる「生成AI」の話題が世間を驚かせています。先月(2月)15日には、OpenAIから動画生成AI(テキストから動画を生成する)「Sora」が登場し、その衝撃的な生成能力には恐怖すら感じます。

ところで、皆さんは有料版ChatGPTを利用していますか。

ご存じの通り、有料版ChatGPTは高い文章生成能力を持っていますが、さらに画像も入力・生成することが可能です。画像とテキストのように異なるデータを扱えるモデルをマルチモーダルAIと呼び、現在多くの注目を集めています。

そこで今回は、動画とテキストを扱えるマルチモーダルAIを使い、簡単な動画認識をしてみようと思います!

続きを読む

固体粒子や液滴を含む工業用画像セグメンテーションと分析のための AI モデルの適用

はじめに

画像処理は、化学、製薬、食品産業などのさまざまなプロセスを理解するために適用できる強力なツールです。画像分析は、多相システムで発生するプロセスの場合によく使用されます。 多相システムは、分散相と連続相の少なくとも 2 つの相で構成されます。 分散相は通常、連続相中に懸濁した液滴または粒子 (固相) の形で存在します。 一方、連続相は液体または気体である可能性があります。 このような多相系には、例えば、エマルジョン(別の液体中の液体の液滴)、サスペンション(液体中の固体粒子)、エアロゾル(気体中の液滴または固体粒子)などが含まれます。多相系で起こるプロセスの例としては、結晶化 (溶液からの結晶の形での化合物の沈殿)、触媒反応 (触媒が固体粒子上に配置された場合)、エマルションの作成 (2つの相互に不溶な液体)またはでんぷんの糊化などがあります。  画像解析により、多相システムの構造をより深く理解できるようになり、プロセスの最適化や強化だけでなく、プロセスのより適切な制御も可能になります。画像解析の一般的な目的は、分散相の液滴または粒子のサイズ分布を見つけることです。 それにもかかわらず、分散相の形態学的特徴 (粒子の形状など) を決定することも重要です。 物体検出用の人工知能モデルの最近の急速な開発により、検出された物体の画像を構成するピクセルを非常に正確に分離できるようになりました (画像セグメンテーション)。 これらの孤立したピクセルは、オブジェクトの形状を表すマスクを形成します。 このオブジェクトが単なる分散相 の粒子(または液滴) である場合、マスクはこの粒子のサイズと形状に関する情報を提供します。 したがって、AIモデルは産業用画像解析に有用と考えられます。 さらに、これらのモデルの使用は簡単に自動化でき、分析時間が短縮されることが期待されます。この導入の最後に、このタイプの写真は通常、似ている形状と外観を持つ同様のオブジェクトで構成されていることを言及する価値があります。 ただし、画像にはかなりの数のそれらが含まれている可能性があります。

このブログでは、データアナリティクス部フバチ・ロベルトが、固体粒子または水滴を含む画像の分析に関する文献の短いレビューを紹介します。 さらに、でんぷん顆粒写真の分析について説明します。

続きを読む

Chat GPTのAIを使ってGoogle Chatを連携させてみた!

はじめまして、クラウドソリューション開発部 新卒1年目の寺谷です。

最近、AI技術が急速に進化し、私たちでも簡単に利用することができるようになりました!

その中でも私が注目しているのは、情報を入力するだけで画像を生成する「Novel AI」と、質問に答えてくれる「Chat GPT」などのAI技術です。

「Novel AI」は、与えられた文章やキーワードに基づいて、小説やイラストを自動生成する能力を持っています。これにより、アイデアの視覚化やデザインの支援、仮想世界の構築など、さまざまな分野で活用できそうですね。

一方、「Chat GPT」は、自然言語処理技術を駆使して、ユーザーの質問や要望に対して自然な会話形式で応答することができます。これにより、様々な情報や知識をわかりやすく伝えることが可能になり、教育や情報検索などの分野で重宝されています。

私自身も、仕事の際に分からない点があれば、Chat GPTをよく活用しています。拡張機能を利用すれば、最近の出来事についても知ることが出来るためとても重宝してます!!

そして今回は、タイトルにもある通りChat GPTのAIとGoogle Chatを連携させてChat Botを作ってみました。

続きを読む