AWS AIサービスでAI学習をもっと身近に!初心者でも始めやすい活用事例


こんにちは!
SJC共同開発推進室の鈴木です。

最近、AIという言葉を耳にしない日はないくらい、あらゆる場面での活用が加速しています。「専門知識がないと無理なのでは?」と感じている方も多いのではないでしょうか。ご安心ください。AWSには、専門知識がなくてもすぐに生成AIを利用できる、便利なサービスがたくさんあります。今回は、AWSのAIサービスをご紹介します。

私自身もAI初心者であり、直近のプロジェクトで間接的にAIに関連するプロジェクトに携わらせていただいており、今後AIに関しての知識が必要になってくるため、最近AWSのサービスを通して、AIの基礎の基礎から学習を始めました。

まず、AWSのAIサービスは主に以下の3段階で構成されております。

  1. アプリケーションレベルのAIサービス(APIまたはGUI操作で簡単に利用できる)
  2. 生成AI・基盤モデルアクセス層(自分でモデルを作らずに高性能のLLMを利用できる)
  3. 機械学習基盤(自由度が高くカスタムAIモデルの構築・トレーニング・運用ができる)

1. アプリケーションレベルのAIサービス(APIまたはGUI操作で簡単に利用できる)

主なサービスとして、以下が挙げられます。

いずれのサービスもGUIが充実しており、入力後すぐに結果が確認できるため、まるでハンズオン教材のように手軽に利用できました。

調べたところ、AWSのAIサービスはすでに多くの企業でも導入されており生産性を大幅に向上させていることがわかりました。

AWSサービス 説明&活用事例
Amazon Rekognition 画像や動画から物体、文字、顔、動作などを検出するサービス

味の素食品株式会社では、Amazon Rekognitionを活用し、製品の画像を撮影して印字された賞味期限の文字列を自動で読み取り、設定ミスを防ぐシステムを構築しました。これにより、目視検査の限界を超え、照合品質と記録の検索性が大幅に向上しています。  

参照元: Amazon Web Services ブログ 味の素食品株式会社の AWS 事例「Amazon Rekognition を用いた製品の賞味期限検出システム」のご紹介: https://aws.amazon.com/jp/blogs/news/ajinomoto-shokuhin-rekognition/

Amazon Transcribe 音声をリアルタイムでテキストに変換するサービス

Slackは動画クリップに自動で文字起こしを生成し、アクセシビリティとコンテンツの検索性を大幅に向上させております。

参照元:AWS Blogs公式 (Slack elevates media pipeline with AWS Elemental MediaConvert and Amazon Transcribe):https://aws.amazon.com/jp/blogs/media/slack-elevates-media-pipeline-with-aws-elemental-mediaconvert-and-amazon-transcribe/

Amazon Polly テキストを自然な音声に変換するサービス

ラジオ放送(エフエム和歌山)で2017 年 7 月より 『人工知能アナウンサー・ナナコ』を通して、ラジオニュースや天気予報の放送で活用されている事例があります。コストは、年間わずか 400〜800 円で、数年前に導入を検討していた他社サービスと比較すると 1,200 分の 1 程度となっております。

参照元:Amazon Polly公式HP:https://aws.amazon.com/jp/solutions/case-studies/fm-wakayama/

Amazon Translate 高品質なニューラル機械翻訳を提供するサービス

多くの企業で海外の顧客からの問い合わせやレビュー、チャットなどをリアルタイムで翻訳し、多言語での顧客サポートに活用されております。

参照元:Amazon Translate公式HP:https://aws.amazon.com/jp/translate/customers/

Amazon Textract スキャン画像やPDFから文字、手書き文字、表形式のデータを抽出するサービス

様々な企業で使用されていて、ヘルスケア、金融、公共部門など幅広い業界で、手動でのデータ入力作業を自動化し、数分で何百万ページもの文書を処理することで、時間とコストを大幅に削減し、業務効率を劇的に向上させています。

参照元:Amazon Textract公式HP:https://aws.amazon.com/jp/textract/customers/

 

また、以下2つのサービスはどの企業でも導入を検討でき、顧客対応や社内業務で効果を発揮できそうと感じました。Amazon LexとAmazon Kendraを組み合わせることで、社内のWiki、ドキュメント管理システム、ファイルサーバー、CRM、人事システムなど、様々な場所に格納された情報を、Lexに質問することで、Kendraが社内ドキュメントからピンポイントで正確な回答を見つけてLexに返して提供してくれるため、手軽に情報を得ることができます。

参照元:Amazon Web Services ブログ

https://aws.amazon.com/jp/blogs/news/integrate-amazon-kendra-and-amazon-lex-using-a-search-intent/

Amazon Lex 会話型AIチャットボットを構築するサービス

企業は顧客からの問い合わせ対応や社内業務支援など、多岐にわたるプラットフォームで会話型AIを簡単に導入・運用できます。その使いやすさと機能性から、すでに多くの企業で幅広く活用されています。

Amazon Kendra AIを活用したエンタープライズ検索エンジン

企業内の様々なデータソース(ウェブサイト、SharePoint、S3、データベースなど)を横断的に検索できます。これにより、情報が散在していても、一箇所から必要な情報にアクセスできます。

 

2. 生成AI・基盤モデルアクセス層(自分でモデルを作らずに高性能のLLMを利用できる)

主なサービスとして、Amazon Bedrockがあります。

Amazon Bedrock:Claude 3, Meta Llama 3, Amazon TitanなどのAPIで統一的に利用可能でプロンプト設計や出力制御も対応している

自分でモデルを作らずに高性能のLLMをAPIで簡単に利用できるため、要約・文生成・QAボットなどの生成アプリ開発に最適です。コンソールで基盤モデルへのアクセスを許可して、すぐに利用することができます。利用したい基盤モデルにアクセスリクエストを送るだけで、すぐにPlaygroundで試したり、APIを通じてアプリケーションに組み込んだりできます。自分でモデルをダウンロード、ホスト、管理する手間が一切ないのも魅力です。

また、ユースケースに合わせて基盤モデルを以下の方法でカスタマイズできます。

    • ファインチューニング (Fine-tuning): 独自のデータセット(例:特定の業界の専門用語を含む文書、企業内のQ&Aデータなど)を用いて、既存の基盤モデルを特定のタスクやドメインに特化させることができ、モデルの応答精度やスタイルを向上させることが可能です。
    • 継続的事前学習 (Continued Pre-training): より大量の組織固有のデータでモデルを事前学習させ、その後のファインチューニングのベースとする、といった高度なカスタマイズも可能です。
    • Knowledge Bases (ナレッジベース): RAG (Retrieval Augmented Generation) と呼ばれる手法で、独自のドキュメントやデータソースを基盤モデルに参照させることで、最新かつ正確な情報を基にした応答を生成させることができます。

 

少しデモで使ってみて、数分で任意のモデルを選び、テキストを入力するだけで、瞬時にAIの応答を得られるため、手軽さが良かったです。また、多くのモデル(Anthropic Claude、Meta Llama 3、Amazon Titanなど)の応答内容を、同じインターフェース上で簡単に比較できる点も魅力だと感じました。特定のタスクに対してどのモデルが最も適しているのか、モデルごとの得意分野を、実際に動かしながら試すことがことができそうです。

 

3. 機械学習基盤(自由度が高くカスタムAIモデルの構築・トレーニング・運用ができる)

主なサービスとして、Amazon SageMaker AIがあります。

データの前処理からモデルの構築、トレーニング、デプロイ、そして運用・監視まで、一貫してサポートするフルマネージドサービスがAmazon SageMaker AIです。

より高度なAI開発を目指すユーザー向けのサービスで、AIモデル開発の全体をカバーしてくれます。データの前処理からモデルの構築、トレーニング、デプロイ、そして運用・監視まで、細かく制御したい場合に最適です。

AIモデルを作成する基本的な流れは、大まかにすると以下の4つのステップです。

  1. データ準備: AIに学習させるためのデータを集め、きれいに整理する作業です。例えば、画像認識のAIなら、たくさんの画像を準備し、それぞれが何を表しているのかをタグ付けするといった作業が含まれます。
  2. モデル構築とトレーニング: 準備したデータを使って、AIモデル(データからパターンを学習し、予測や判断を行う仕組み)を構築し、学習(トレーニング)させます。この段階で、AIはデータの中からルールや特徴を学び取っていきます。
  3. デプロイ: トレーニングが終わったAIモデルを、実際に使えるようにする段階です。ウェブアプリケーションに組み込んだり、スマートフォンアプリで利用できるようにしたりするなど、様々な形で利用可能にします。
  4. 運用・監視: デプロイしたAIモデルがきちんと動いているか、期待通りの性能を出しているかを常にチェックし、必要に応じて改善していく段階です。

SageMakerの中だけで必要なツールが揃っており、すぐに環境構築ができるのが魅力だと感じました。また、他の外部ツールを別途用意したり連携させたりすることなく、SageMakerのプラットフォーム内でAI開発の全工程を完結できるのも初学者にとって、とても分かりやすく感じました。

また、Amazon SageMaker AIの中のアプリケーションの中にはSageMaker Canvas(ノーコードML)があり、データの準備からモデルの構築、トレーニング、予測までの一連のプロセスを、GUI操作だけで行えるので、最初の導入にはとても良いと感じました。

ただ注意点として、SageMaker Canvasは使用した後にログアウトしないと使用していなくても利用料金が発生してしまいます。私も、たまにログアウトを忘れてしまい料金が発生することがありました。

 

Canvasで作成したモデルの基盤や学習データなどを、より詳細なカスタマイズが可能な通常のSageMaker環境で引き継ぎ、さらに複雑なモデルの構築や、より詳細なチューニングなどができるということで、最初はCanvasを活用して、慣れてきたら通常のSageMakerを利用すると、段階的に理解していきやすいと感じました。

 

まとめ

いかがでしたでしょうか?AWSの生成AIサービスを使えば、専門的なAI知識がなくても、お手軽に高度な生成AIの機能をアプリケーションに組み込むことができます。
「AIをビジネスに活用したいけど、何から手をつけていいか分からない」と感じていた皆さん、ぜひこの機会にAWSの生成AIサービスに触れていただければと思います。AWSのAIサービスを活用することで、敷居を下げて学習することができると感じました。今回のAWSでAIの基礎を学びAI Practitioner の資格を取得することができたので、引き続きAWSのAIサービスを通して基礎学習を進めていきたいと思います。

エコモットでは、ともに未来の常識を創る仲間を募集しています。
弊社に少しでも興味がある方はぜひ下記の採用ページをご覧ください!