7, 8月に続き、IT・科学記事ピックアップをします〜
できるだけ毎日更新して、毎日分の記事をチェックしたいと思います。
今月も頑張るぞ!
【2023/10/1追記】
9月のまとめとして、「これだけ見ればOK!2023年9月のテクノロジーニュースまとめ」という章を追加しました。とくに、「今月のニュースの重要用語」だけでもみていただけると、新しい技術の話題についていきやすくなると思います。
- これだけ見ればOK!2023年9月のテクノロジーニュースまとめ
- 2023/9/30のピックアップ
- 2023/9/29のピックアップ
- 2023/9/28のピックアップ
- 2023/9/27のピックアップ
- 2023/9/26のピックアップ
- 2023/9/25のピックアップ
- 2023/9/24のピックアップ
- 2023/9/23のピックアップ
- 2023/9/22のピックアップ
- 2023/9/21のピックアップ
- 2023/9/20のピックアップ
- 2023/9/19のピックアップ
- 2023/9/18のピックアップ
- 2023/9/17のピックアップ
- 2023/9/16のピックアップ
- 2023/9/15のピックアップ
- 2023/9/14のピックアップ
- 2023/9/13のピックアップ
- 2023/9/12のピックアップ
- 2023/9/11のピックアップ
- 2023/9/10のピックアップ
- 2023/9/9のピックアップ
- 2023/9/8のピックアップ
- 2023/9/7のピックアップ
- 2023/9/6のピックアップ
- 2023/9/5のピックアップ
- 2023/9/4のピックアップ
- 2023/9/3のピックアップ
- 2023/9/3のピックアップ
- 2023/9/2のピックアップ
- 2023/9/1のピックアップ
これだけ見ればOK!2023年9月のテクノロジーニュースまとめ
今月のニュースの重要用語
- PLaMo-13B:PFNが発表したLLMで日英合わせた能力が世界最高
- Mistral 7B:オープンソースのLLM
- SFT(Supervised Fine-Tuning):教師ありファインチューニング
- RLHF(Reinforcement Learning from Human Feedback):人間のフィードバックでLLMを調整
- RAG (Retrieval-augmented Generation):LLMモデル外の知識を利用してLLMに解答を生成させる
- LLM-as-a-judge:LLMを用いてLLMの評価をするアプローチ
- CoVe:LLMの出力からハルシネーションを減らす手法
- ChatGPTにおいて音声による対話、画像についての質問 (ChatGPT-4V)が可能に
- ChatGPTがwebブラウジング機能を搭載
- Nougat:数式なども認識するOCR
- Flash Attention:長いSequenceでのTransformer学習ができるようにする
- Vision-Languageモデル:視覚情報とテキストを組み合わせて処理できるモデル(BLIP, Flamingo, Git, BLIP-2)
- Microsoftの「AutoGen」:複数名のAIエージェントで処理
- Java21リリース
- Nue:新しいフロントエンド開発ツール
- Amazon Bedrock:AWSでLLMを扱えるようになった:
- Open Interpreter:OpenAIのCode Interpreter(現Advanced Data Analysis)をローカル環境で
- Mojo言語:Pythonのライブラリが使えて、C言語のように速い
LLM
あたらしく発表されたLLM
2023/9/1 コード専用生成AI「WizardCoder」、米Microsoftが公開 ベースはCode Llama、高い精度を達成
2023/9/13 算術タスクでGPT-4を圧倒的に上回るコンパクトなモデル『MathGLM』登場。やはりステップ・バイ・ステップが重要
2023/9/15 ChatGPTのライバルと目されるGoogleのAI「Gemini」がリリース間近
2023/9/15 Llama2の15倍速いDeciLMが登場!
2023/9/21 GPT-4を上回るオープンなLLM誕生? 中国研究者らが「Xwin-LM」公開
2023/9/28 中国で最も人気のあるLLM「星火認知(SparkDesk)」を試してみました。
2023/9/28 Google Colab で Preferred Networks の PLaMo-13B を試す
2023/9/28 Meta、対話型アシスタント「Meta AI」全面展開 情報共有・画像生成など
2023/9/28 本当にオープンソースのライセンスで利用&検証できる大規模言語モデル「Mistral 7B」が登場、「Llama 2 13B」や「Llama 1 34B」を上回る性能のAI開発が可能
2023/9/28 PFN、日英言語対応で世界トップレベルのLLM「プラモ」
2023/9/28 PFNが生成AI新会社「Preferred Elements」設立へ 130億パラメータの和製LLMもオープンソースで公開
LLMに関する技術
2023/6/5 Pytorch2.0でFlash Attentionを使ってみた話
2023/9/4 最近のLLMの学習法のまとめ – SFT・RLHF・RAG
2023/9/18 論文探訪:大規模言語モデルのための電子透かし (A Watermark for Large Language Models)
2023/9/25 GPT-4などのLLMをエージェントとして既存ゲームシステムに導入し、NPCをAI化するツール『MindAgent』登場
2023/9/25 LLMを用いたLLMの自動評価について ~可能性と注意点~
2023/9/27 LLMの出力から誤り(ハルシネーション)を減らす新手法『CoVe(Chain-of-Verification)』と実行プロンプト
2023/9/29 Azure Machine Learning のモデルカタログに OpenAI, Llama 2, Vision モデルが勢ぞろい!
2023/9/29 米Microsoft、“ChatGPTの目と耳実装”の影で画像対応の生成AI「DeepSpeed-VisualChat」開発
LLMに関するまとめ
2023/9/4 大規模言語モデル
2023/9/20 Stability AI Japanにおける大規模言語モデルの研究開発
2023/9/20 ローカルLLM のリリース年表
RAG:LLMモデル外の知識を利用してLLMに解答を生成させる
2023/6/9 Retrieval Augmented Generationを改良する2つの方法
2023/6/14 OpenAIのAPIを使って自社ブログ(DevelopersIO)の記事をベクトル検索するボットをつくってみた
2023/6/27 OpenAIのAPIを使って営業資料をベクトル検索するボットをつくってみた
2023/7/10 ベクトル検索で「以外」や「数字の大小」を試してみたら難しそうだった
2023/7/16 ベクトル検索で欲しい情報が得られないときの問題点と改良方法を考えてみた
2023/8/29 【Google Cloud】Enterprise Searchで社内ドキュメントを検索してみた
2023/9/1 Google Cloud Enterprise SearchとRetrieveReadCompose方式RAGを利用して社内公式情報を全部質問できるようにしてみた
2023/9/22 RAGを使った社内情報を回答できる生成AIボットで業務効率化してみた
2023/9/23 RAG処理の改善: langchainでハイブリッド検索を実装してみる(勉強メモ)
2023/9/25 RAGのGが必要か不要かに関する一考察
OpenAI
2023/9/21 ChatGPTに完全統合して会話から画像を生成できるAI「DALL-E 3」をOpenAIが発表、前世代よりテキストに忠実で安全性も向上
2023/9/26 OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化
2023/9/26 ついにChatGPTが「見る」「聞く」「話す」に対応、人間と同じように音声で会話したり写真の内容について質問したりできる
2023/9/25 ChatGPTのマルチモーダルな新機能
2023/9/28 「ChatGPT」がインターネットから直接知識を得るように ~近日中に全ユーザーに解放
2023/9/28 ChatGPT、Webブラウジング機能を復活 最新情報を利用可能に
2023/9/28 Azure OpenAI Service に gpt-35-turbo-instruct モデルが追加
2023/9/28 ChatGPT商用利用時、規約上の注意点3つ|元ITエンジニアの弁護士が徹底解説
2023/9/29 ChatGPTの10ヶ月と開発トレンドの現在地
2023/9/30 GPT-4V(ision)登場からの初3日間:注目のビジネス活用事例集
生成AI
2023/9/1 Metaが高性能映像処理モデル「DINOv2」のライセンスを更新して商用利用が可能に、同時にモデルの「公平性」を評価するためのデータセット「FACET」も公開へ
2023/9/14 テキストで指定した音楽を自動で生成するAI「Stable Audio」が登場
2023/9/21 Amazonが音声認識アシスタントAlexaに生成AIを導入、複雑なリクエストを処理可能に
2023/9/23 文章一行でAIがWebサイト構築、外部資金調達なしで5.4万ユーザを集めた豪Relume——NikeやDapper Labsも利用
2023/9/25 Amazon、OpenAI競合のAnthropicに最大40億ドル投資 AWSでモデル開発
2023/9/26 安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images powered by NVIDIA」をフォトストックサービスのGetty Imagesが発表
2023/9/26 商用利用が可能なAIアート用画像生成AI、EmiとManga Diffusionを無償公開
2023/9/27 “不自然さのない”アイコラ画像を数枚の顔写真から生成するAI 韓国チームが開発
2023/9/27 モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用
機械学習・AI一般
2023/9/5 グラフ構造学習を評価するためフレームワーク、米Googleが開発 4000以上のアーキテクチャを統一
2023/9/5 AIがチームを組み、ゲーム攻略するシステム 中国チームが開発 マインクラフトなどで実験
2023/9/5 数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』
2023/9/7 多様な役割のAIエージェント達に協力してソフトウェアを開発してもらう『ChatDev』登場。論文内容&使い方を解説
2023/9/11 AIが見た目に対する物理的感覚を獲得。「変形しにくい容器はどっち?」などに正確に回答
2023/9/12 Adobe、動画内の人やモノを認識し分離するビデオセグメンテーション機能「DEVA」を発表【研究紹介】
2023/9/15 新しいタンパク質をアミノ酸配列から生成するAI「EvoDiff」をMicrosoft Researchが開発、タンパク質工学に大きな進展か
2023/9/18 Flash Attentionを使ってLLMの推論を高速・軽量化できるか?
2023/9/20 最近話題の Vision-Languageモデル まとめ
2023/9/21 脳のゆらぎを取り入れて AI を安全にする 東京大学 ――深層ニューラルネットワークの隠れ層にゆらぎを導入し脆弱性を軽減――
2023/9/22 BLIP,BLIP-2
2023/9/25 Metaはさまざまな性格を持ったAIチャットボット「Gen AI Personas」を開発中、若者向けの「生意気なロボット」など
2023/9/27 「AIが人類を支配したら?」が現実味を帯びてきた件 加速する“AIアライメント”議論の現在地
2023/9/29 複数名のAIエージェントにより、複雑なタスクも対応できるようになりました:AutoGen
2023/9/29 「急速に増える“非英語論文”の検索に」──米Googleら、多言語間でも論文同士の関連性を計算できるモデル開発
2023/9/29 AIビジョンのバイアス低減へ、ソニーとメタが新ツール
ソフトウェア開発
2023/9/11 JavaScriptランタイム「Bun 1.0」正式リリース。Windows版もまもなく登場へ
2023/9/15 NTT、データを暗号化したまま処理する「秘密計算」国際標準化
2023/9/18 インストールごとに料金が発生する「Unity Runtime Fee」のポリシーをUnityが見直し表明
2023/9/19 「Java 21」正式リリース。仮想スレッドが正式版に、入門者向けに「void main」と簡潔な記述、世代的ZGCなど新機能
2023/9/21 あたらしいフロントエンド開発ツール「Nue」
2023/9/22 新興のJavaScriptフレームワークNueとは?公式サイトざっくりまとめ
2023/9/26 ウェブ開発の未来を左右するかもしれない大規模アンケート「State of HTML 2023」がスタート
Amazon Bedrock関係
ついにきましたAmazon Bedrock!2023年4月にプレビュー版が発表されていましたが、2023/9/29に一般公開されました。OpenAIのGPT-4は使えませんが、代わりにAnthropic社のClaude 2が使えます。Bedrockの強みはAWSのさまざまなサービスと連携できるところですね。MicrosoftはOpenAIと協業してAzure OpenAI Serviceを提供しているので、これから競争が激しくなりそうです。
Amazon Bedrock (以下、 Bedrock )は AWS 上で使える、大規模言語モデル( LLM )の基盤モデルを提供する完全マネージド型サービスです。2023年9月28日に GA となり、現在、以下のリージョンで利用可能です(東京リージョンはまだ非対応です)。・バージニア北部( us-east-1 )・オハイオ( us-east-2 )・オレゴン( us-west-2 )・シンガポール( ap-southeast-1 )基盤モデルはサーバレスで動作するため、モデルの起動・停止を気にすることなく、アプリケーションに LLM を組み込むことができます。さらに、 AWS のネットワーク内で利用可能なため、安全に使用できます。また、 Bedrock では複数のモデルが用意されており、それぞれのユースケースに合ったモデルを選択することができます。
2023/9/29 AWSの生成AIサービスである Amazon Bedrock がGAになったので早速使ってみた
2023/9/29 AWS上で生成AIを使用するためのツール「Amazon Bedrock」が正式リリースへ、日本語を話せるClaudeや画像生成のStable Diffusionを利用可能
2023/9/29 AWS提供の生成AIサービスが一般開放 新たにLlama 2も利用可能に
2023/9/29 【速報】AWSの生成AIサービスであるAmazon Bedrock がリリースされたので朝イチで触ってみた
2023/9/29 Amazon Bedrock “Claude 2” と、ChatGPT “GPT-4” を比較してみる
2023/9/29 Amazon Bedrockのモデル仕様やその料金について整理してみた
2023/9/29 Amazon Bedrock正式リリースの公式ブログを日本語で簡潔にまとめました
2023/9/29 Amazon BedrockのAPIをPythonアプリから呼んでみよう。LangChainにも挑戦!
2023/9/29 [Amazon Bedrock] 話題の Amazon Bedrock をインターフェイス型 VPC エンドポイントでプライベートに利用したい
2023/9/29 Amazon Bedrock Workshop (テキスト生成ラボ編、動くようにしておいたよ!
2023/9/30 Amazon Bedrock が GA されたのでモデルのプロバイダー概要と料金体系を調べてみた
2023/9/30 Amazon Bedrock をマネジメントコンソールからちょっと触ってみたいときは Base Models(基盤モデル)へのアクセスを設定しましょう
話題のOpen Interpreter関係の記事
最近、Open Interpreterが話題になっていますね!なかなか面白そう。わたしもつかってみて記事を書きたいと思います。いろいろ記事を読んだ感じとしては、「面白いし将来性はあるけど、実用に足るほどの力はない」という印象なのですが、これが進歩すると本当に人間要らなくなる感じがするので、追いかけていきたいと思っています。
Open Interpreterについては凄すぎると話題の「Open Interpreter」の始め方・使い方まとめに簡潔にまとまっていましたので引用します。
このツールは、OpenAIが提供するChatGPTの「Advanced Data Analysis(旧Code Interpreter)」のオープンソース版とも言える存在で、Python、Javascript、Shellなどのプログラミング言語のコードを自然言語による対話を通じてローカル環境で実行することができます。
このツールの最大の特徴は、ChatGPTの「Advanced Data Analysis」と違いローカル環境で動くため、ファイル容量やネット接続への制約がなく、ChatGPTの「Advanced Data Analysis」より幅広い使い方ができます。
そのため、Open Interpreterを使えば、プログラミングの知識がない方でも、Chromeブラウザでのリサーチ、大量データの分析など、多岐にわたる作業をチャット形式で簡単に行うことができます。
2023/9/8 Open Interpreter – 自然言語でコーディングを実現するオープンソースツール
2023/9/8 OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる
2023/9/11 凄すぎると話題の「Open Interpreter」の始め方・使い方まとめ
2023/9/12 Open Interpreterを使ってデータ分析ができるかやってみる
2023/9/12 (YouTube動画)Open Interpreterの実力は?GPT-4との連携で最新ニュース取得&ゲーム制作にチャレンジ!
2023/9/13 Open Interpreter
2023/9/14 Open Interpreterのログ解析して、何が行われているのか確認してみた
2023/9/15 Open InterpreterをDev Containerで動かす
2023/9/16 話題のOpen Interpreterを使ってみた、そして、驚いたw
2023/9/27 Open Interpreterに別のお題を出してみた、結果、色々と使えそうだw
2023/9/27 Open Interpreterのアップデート – 2023年9月26日
2023/9/27 ついに来たローカルAIデータ分析! Open InterpreterとAzure OpenAI Serviceで機密データも安全にハンドリング
2023/9/29 MacでOpen-interpreterのインストールとR言語の実行について: Macターミナル上でLLMを動かしてみよう
話題のMojo言語関係の記事
「Pythonのライブラリが使えて、C言語のように速い」という触れ込みのMojo言語が話題になっていますね。https://www.modular.com/mojo
今後のデータサイエンス領域の主要言語に躍り出る可能性もありますね。
2023/5/6 Mojoは「C言語のように速いPython」なのか
2023/8/29 Mojoプログラミング言語の紹介
2023/9/8 Mojo入門 (1) – 事始め
2023/9/10 Mojo入門 (2) – Mojo言語の基本
2023/9/11 Mojo入門 (3) – MojoモジュールとMojoパッケージ
2023/9/11 Pythonの高速なスーパーセットをうたう新言語「Mojo」、コンパイラなど公開、ローカル環境で利用可能に
2023/9/18 Pythonと互換性を保ちつつ、非常に高速に動作することで話題のMojoをGoogle Colab上で動作させる方法
リーダー・マネージャー向け記事
2023/9/12 優秀なエンジニアの採用成功に近づける6つのステップをプロが解説!
2023/9/19 メンターを始める時に考えていること
2023/9/20 【産業医が教える】ストレスによるメンタル不調の自己ケアと、雇用する企業側に求められる対策
2023/9/26 そのコードはユーザーに価値を届けているか?少数精鋭で生産性の高い開発組織を目指す10Xの挑戦
2023/9/30 【学生必見】メンターが見た学生向け夏インターン2023(ドコモハッカソン)の裏側
2023/9/30のピックアップ
2023/9/30 医師がスマホのアプリを“処方”「治療支援アプリ」利用広がる
医師がスマートフォンのアプリを「処方」して、患者の治療につなげる「治療支援アプリ」の利用が広がり始めています。国の承認を受けた高血圧症の「治療支援アプリ」を開発した会社は、実際に利用した患者での効果を分析したデータを公開し、幅広い年代で血圧を下げる効果が示されたとしています。
2023/9/30 画像生成AIで部屋の写真を読み込んでプロンプトを入力するだけで好きな家具を破綻なく描き足してくれる「Fill 3D」が登場
画像生成AIで部屋の写真内に家具を生成する「Fill 3D」が発表されました。Fill 3Dは写真に写っている部屋の立体構造と照明を把握した上で、写真上の任意の場所にプロンプトで入力した家具をそのまま生成することができます。
2023/9/30 NFTは死んでしまい大部分が無価値になっているとの指摘
デジタルなコンテンツにブロックチェーンを用いて独自性と価値を付与するNFTは2021年から2022年にかけて取引のピークを迎えましたが、すぐに市場の熱は冷めてしまい、およそ2300万人のNFTが無価値なものになってしまったことが指摘されています。NFTを巡る隆盛と衰退、そしてこれからについて、NFT専門家のヴラド・ハテガン氏が解説しています。
2023/9/30 GPT-4V(ision)登場からの初3日間:注目のビジネス活用事例集
GPT-4V(ision)の登場により、従来のコードインタプリタを超える大きな話題が生まれています。この技術革命の波に乗ることで、ビジネスのフロントラインでの新しい可能性が広がりつつあります。わずか数日で、多くのビジネス界からの注目と実際の活用事例が登場しています。この技術がもたらす新しい可能性を、具体的な事例を通じて皆様にご紹介します。これらの事例が、今後のビジネス戦略に役立つヒントやインスピレーションとなることを願っています。
2023/9/30 Autonomous Database:SELECT AI機能を使用してOpenAIを利用した自然言語によるクエリ実行を試してみた(日本語でも実行できた)
Autonomous Databaseで、自然言語からSQLを生成するSELECT AI機能が利用可能になったので、早速試してみました。https://docs.oracle.com/en/cloud/paas/autonomous-database/serverless/adbsb/sql-generation-ai-autonomous.html#GUID-9CE75F94-7455-4C09-A3F3-118C08E82B7E
2023/9/30 ネコにマタタビ “依存性なく毒性なし” 岩手大など研究G
ネコと植物のマタタビの関係について研究している岩手大学などの研究グループは、ネコにマタタビを嗅がせ続けても依存性はなく体にも毒性がないことがわかったと発表しました。そのうえでマタタビからネコが反応する成分を抽出したスプレーを開発しました。
2023/9/30 【学生必見】メンターが見た学生向け夏インターン2023(ドコモハッカソン)の裏側
NTTドコモサービスイノベーション部の川波です。8/29~9/1の4日間で開催された「学生向け夏インターン2023(ドコモハッカソン)」にメンターとして参加してきました。 実際に参加してみると、4日間という短い期間であるにも関わらず学生の凄まじい成長を目の当たりにし、非常に良いイベントだなと感じましたので、ハッカソンの情報を交えつつメンターの私視点から見たドコモハッカソンの裏側をご紹介できればと思います!
2023/9/30 Preferred NetworksのPLaMo-13BをDatabricksで動かしてみる
2023/9/28 日英2言語対応の大規模言語モデルPLaMo-13Bを研究・商用利用可能なオープンソースソフトウェアライセンスで公開
株式会社Preferred Networks(本社:東京都千代田区、代表取締役 最高経営責任者:西川徹、以下、PFN)は、開発した130億パラメータの事前学習済み大規模言語モデル PLaMo™-13B(Preferred Language Model、プラモ)を、研究・商用で利用可能なオープンソースソフトウェア(OSS)ライセンスで本日公開(https://huggingface.co/pfnet/plamo-13b)しました。本モデルは、現在公開されている同規模のパラメータ数の事前学習済み言語モデルと比べ、大規模言語モデルのベンチマーク評価(lm-evaluation-harness)において、日英2言語をあわせた能力で世界トップレベルの高い性能を示しています。
2023/9/28 PLaMo-13Bを公開しました
2023/9/30 Amazon Bedrock が GA されたのでモデルのプロバイダー概要と料金体系を調べてみた
Amazon Titan Text – Lite モデルで 8,000 トークンの入力を 2,000 トークンの出力に要約するようリクエストする場合、約0.5円です(1 ドル 149 円で計算)。プロバイダーの読み方も調べました。
2023/9/30 Amazon Bedrock をマネジメントコンソールからちょっと触ってみたいときは Base Models(基盤モデル)へのアクセスを設定しましょう
コーヒーが好きな emi です。AWS の生成 AI サービス、Amazon Bedrock が満を持して GA されました。 マネジメントコンソールからちょっと触って見ようとしたところ、初手で躓いたので共有します。
2023/9/29のピックアップ
Amazon Bedrock関係
2023/9/29 AWSの生成AIサービスである Amazon Bedrock がGAになったので早速使ってみた
Amazon Bedrock (以下、 Bedrock )は AWS 上で使える、大規模言語モデル( LLM )の基盤モデルを提供する完全マネージド型サービスです。2023年9月28日に GA となり、現在、以下のリージョンで利用可能です(東京リージョンはまだ非対応です)。・バージニア北部( us-east-1 )・オハイオ( us-east-2 )・オレゴン( us-west-2 )・シンガポール( ap-southeast-1 )基盤モデルはサーバレスで動作するため、モデルの起動・停止を気にすることなく、アプリケーションに LLM を組み込むことができます。さらに、 AWS のネットワーク内で利用可能なため、安全に使用できます。また、 Bedrock では複数のモデルが用意されており、それぞれのユースケースに合ったモデルを選択することができます。
2023/9/29 AWS上で生成AIを使用するためのツール「Amazon Bedrock」が正式リリースへ、日本語を話せるClaudeや画像生成のStable Diffusionを利用可能
**2023年4月にアナウンスされていた生成AIをAWSで使えるようにするツール「Amazon Bedrock」が2023年9月28日に正式リリースされ、一般ユーザーへの提供が開始されました。Amazon Bedrockはインフラストラクチャの管理が不要なサーバーレスで生成AIを利用するためのツールです。サービスがAWS上で提供されているため、Amazon CloudWatchやAWS CloudTrail**を使用して利用状況やAPIの状況を監視することが可能です。
2023/9/29 AWS提供の生成AIサービスが一般開放 新たにLlama 2も利用可能に
米AWSは9月28日(現地時間)、生成AIをAPI経由で利用できるサービス「Amazon Bedrock」の一般提供を始めた。同サービスは4月の発表以来、プレビュー版での提供だった。Amazon Bedrockは、Amazonの大規模言語モデル「Amazon Titan」、米Anthropicの「Claude 2」、イスラエルAI21 Labsの「Jurassic-2」、画像生成AI「Stable Diffusion」などをAPI経由で利用できるサービス。一般提供に合わせ、新たに米MetaのLLM「Llama 2」の70億パラメータモデルと13億パラメータモデルにも近日中に対応予定と予告した。
2023/9/29 【速報】AWSの生成AIサービスであるAmazon Bedrock がリリースされたので朝イチで触ってみた
AWSにおける生成AIサービスであるAmazon Bedrockがリリースされました。生まれたばかりのAmazon Bedrockを実際に触って、どんな機能があるのか検証してみたいと思います。
2023/9/29 Amazon Bedrock “Claude 2” と、ChatGPT “GPT-4” を比較してみる
「Amazon Bedrock」は言うまでもなくサーバレスであり、インフラの運用が不要であることに加え、ChatGPTとは異なりIAMによるセキュリティの管理も可能です。 「Amazon Bedrock」では、OpenAIのGPT-4こそ使えませんが、元OpenAIの社員によって設立されたAnthropic社の大規模言語モデルであるClaude 2が利用できます。 Claude 2は、日本語の大規模言語モデルの評価を行う「Rakuda Ranking of Japanese AI」で、GPT-4に次いで2番目に高評価を得ています。
2023/9/29 Amazon Bedrockのモデル仕様やその料金について整理してみた
こんちには。データアナリティクス事業本部 インテグレーション部 機械学習チームの中村です。Amazon Bedrockがリリースされましたね。この記事ではモデルの仕様やその料金について整理してみました。なお、記載内容は本日時点での公式情報を参考にしていますのでご了承ください。
2023/9/29 Amazon Bedrock正式リリースの公式ブログを日本語で簡潔にまとめました
これです。英語ですし長いですよね。サマりました。https://aws.amazon.com/jp/blogs/aws/amazon-bedrock-is-now-generally-available-build-and-scale-generative-ai-applications-with-foundation-models/
2023/9/29 Amazon BedrockのAPIをPythonアプリから呼んでみよう。LangChainにも挑戦!
昨晩時点では未対応だったPython用のAWS SDK(boto3)もようやくBedrockに対応したようです!https://github.com/boto/boto3/blob/develop/CHANGELOG.rst
2023/9/29 [Amazon Bedrock] 話題の Amazon Bedrock をインターフェイス型 VPC エンドポイントでプライベートに利用したい
話題の Amazon Bedrock をVPC エンドポイント経由で利用してみました。インターネットを出ずに利用可能となれば利用の幅も無限大!
2023/9/29 Amazon Bedrock Workshop (テキスト生成ラボ編、動くようにしておいたよ!)
本日(2023/9/29)、Amazon Bedrock Workshopが公開されました。コンテンツとしては、以下の内容となっており、今回はやってみて詰まったところについて修正加えながらまとめていきます。 https://catalog.us-east-1.prod.workshops.aws/workshops/a4bdb007-5600-4368-81c5-ff5b4154f518/ja-JP
LLM関係
2023/9/29 Azure OpenAI Serviceの日本語記事まとめ
Azure OpenAI Serviceについての日本語記事のまとめです。主に公式ドキュメント以外のブログやZenn/Qiitaの記事をまとめています。ボリュームが多いので、目次から気になる項目を選択してご覧ください。※長く使える知見のまとめにしたかったので一過性のニュース的な記事や内容が重複している機能紹介記事などは意図的に掲載していません。
2023/9/29 ChatGPTの10ヶ月と開発トレンドの現在地
9/28の #日本CTO協会 さんのイベントで登壇した資料を公開しました。「ChatGPTの10ヶ月と開発トレンドの現在地」開発のトレンドの最新情報をざっくり纏めています。・Prompt Engineering開発の現在地・RAG開発の現在地・Plugin開発の現在地・GPT-Vの登場と生成AI時代のこれからについてやや開発者寄りな内容なので、基礎を知りたい場合はAzure OpenAI大全も併せてご確認を。(こっちも近々最新化します…)ChatGPT – Azure OpenAI 大全
2023/9/29 OpenAI APIのfunction callingを使ってみる
ChatGPTを擁するOpenAI社のAPI「OpenAI API」を利用したアプリ制作を行う中で、新しい機能である「function calling」を利用する機会がありました。今回は備忘録として使い方を書いていきます。
2023/9/29 複数名のAIエージェントにより、複雑なタスクも対応できるようになりました:AutoGen
AI Agentは最近非常に注目されてる領域です。先月公開されたOpen interpreterは、自動的にコードを作成してもらうために非常に人気となりました。ですが、多くの状況はAI自身で判断することができず、かなり具体的な指示が必要なので、何度も質問を繰り返して一歩一歩進める必要がありました。その後、1ヶ月も経たないうちに、先日MicrosoftがMulti AI Agent OSS、「AutoGen」を正式にリリースしました。(今githubでtop5トレンドのOSSとなっています)AutoGenは、複数名のAIエージェントで構成されたOSSです。特徴としては、一人のAIエージェントで作業するではなく、複数名のAIたちが会話する形で協力して作業を進めます。(事前にAIたちそれぞれに役割をpromptで設定します。この前話題になったChatDevと似てます)今までChatGPT一人で対応できない作業をチームで進めるとうまく実現できるようになりました。
2023/9/29 【OpenAI API】presence_penaltyとfrequency_penaltyの違い
OpenAI APIを用いて、GPTによる返答を生成する際、様々なパラメータを指定することができる。そのパラメータの中で、presence_penaltyとfrequency_penaltyの違いが分かりにくかったので解説する。
2023/9/29 Azure Machine Learning のモデルカタログに OpenAI, Llama 2, Vision モデルが勢ぞろい!
Azure Machine Learning および今後発表が期待される Azure AI Studio のモデルカタログを使うとどなたでも Azure OpenAI Service のモデルや Llama 2 のモデル、画像認識モデルなど様々なオープンソース、Hugging Face モデルをファインチューニングしたりマネージドオンラインエンドポイントにデプロイできます。モデルカタログは Azure のクラウド機械学習基盤である Azure Machine Learning 上に作られているため、簡単にトレーニング用の VM をアタッチできますし、MLOps/LLMOps で使える様々な機能がすでに準備されています。
2023/9/29 生成AIで電話応対を効率化 最大54%の時間削減に成功 ELYZAとJR西日本のコンタクトセンターの事例
今最も話題になっているテクノロジーといえば、生成AIといっても過言ではないだろう。米OpenAIのAIチャット「ChatGPT」の出現以降、生成AIのビジネス利用を検討する企業も少なくない。そんな中、AIベンチャーのELYZAは、JR西日本のコンタクトセンターと共同で、言語生成AIを使って一部業務の効率化に成功したと発表した。
2023/9/29 米Microsoft、“ChatGPTの目と耳実装”の影で画像対応の生成AI「DeepSpeed-VisualChat」開発
Microsoftに所属する研究者らが発表した論文「DeepSpeed-VisualChat: Multi-Round Multi-Image Interleave Chat via Multi-Modal Causal Attention」は、複数枚の画像とテキストを処理できる大規模言語モデル(LLM)を提案した研究報告である。DeepSpeed-VisualChatは最大70Bパラメータの言語モデルのサイズにおいて優れた拡張性を示した。
2023/9/29 MacでOpen-interpreterのインストールとR言語の実行について: Macターミナル上でLLMを動かしてみよう
今回は、macOSにOpen Interpreter(バージョン open-interpreter-0.1.6 & openai-0.28.1)をインストールし、その設定とターミナル上でのGPT-4の動作を確認した結果を報告します。
2023/9/29 OpenAI EvalsをAzure OpenAI ServiceのLLMモデルで動かす方法
OpenAI Evals は OpenAI 社が提供するLLMコンポーネントの評価フレームワークです。・LLMに対する入力と期待する回答の組み合わせのデータセット・LLMによる回答と期待する回答の評価を行うEvalクラス・LLMを呼び出すLLMコンポーネントを定義するCompletionFnクラス この三つの要素を柔軟に組み合わせてLLMの性能評価を繰り返し定量的に行うことが出来るフレームワークとなっています。
その他
2023/9/29 教科書制作からYouTuberに転身し、ヒットを連発。人気チャンネル「ゲームさんぽ」の着眼点
YouTubeチャンネル「ライブドアニュース」にて2019年にシリーズ化された「ゲームさんぽ」。気象予報士や弁護士、精神科医、探偵といったさまざまなジャンルのプロとともにゲームの中を散歩するというスタイルが話題を集め、スタート時から100万再生越えの動画コンテンツを量産する人気企画です。当初から中の人として「ゲームさんぽ」の企画制作を担当していたいいださんは2023年3月に独立し、株式会社よそ見を設立。個人チャンネルでゲームさんぽをリスタートさせました。大ヒット企画を生み出し続けるいいださんに、企画の着眼点や、愛される企業コンテンツの作り方についてお話を伺いました。
2023/9/29 サーバ進化の技術的模索を振り返る 10年前に「ムーアの法則が終わる」と言われたときから現在まで(後編)
ほぼ10年前は「ムーアの法則が終わる」と本格的に言われ始めた頃で、そこから実はさまざまな技術、例えばストレージクラスメモリやFPGAやメモリドリブンコンピュータなどのプロセッサの回路の微細化以外の技術によるサーバの性能向上技術が注目され、その一部は市場に投入され定着しつつある一方で、商業的な成功を収められなかった多くの技術もありました。それらをざっと振り返る内容にしたところ、現在のサーバ技術の方向性がなんとなく見えてきたのではないかと思うので、ここで記事として紹介します。記事は前編と後編に分かれています。いまお読みの記事は後編です。
2023/9/29 なぜネコは箱の中が大好きなのか?
ネコをペットとして飼った経験のある人なら、空き箱の中に入ったネコがいつまで経っても出てこない、という経験をしたことがあるはず。なぜネコは箱が好きなのかについて、科学雑誌の**Discover**がまとめています。
2023/9/29 パナを追うソニーも新製品を続々投入(ただし来年) 「IBC2023」で読み解く放送IPの最新動向
国際放送機器展と名の付くものとしては、例年4月に米国ラスベガスで開催される「NAB」がよく知られるところだが、ヨーロッパではオランダのアムステルダムで開催される「IBC」も大きなイベントである。今年は9月15日から17日の日程で開催された。
2023/9/29 「急速に増える“非英語論文”の検索に」──米Googleら、多言語間でも論文同士の関連性を計算できるモデル開発
米Google ResearchとSizzle AIに所属する研究者らが発表した論文「OpenMSD: Towards Multilingual Scientific Documents Similarity Measurement」は、多言語に対応した科学論文の類似度を測定するモデルと、多言語で書かれた論文が大量に収録されるデータセットを提案した研究報告である。
2023/9/29 AMDの最優先事項は「ROCm(Radeon Open Compute platform)」の発展だとAMD幹部が明言、オープンソースのプログラミング言語「Triton」の採用でNVIDIAに反撃へ
アメリカの半導体メーカー「AMD」はCPUシリーズの「Ryzen」やGPUシリーズ「Radeon」の開発や製造を行っています。そんなAMDは自社の最優先事項について、「機械学習向けGPU環境やプラットフォームの**ROCm**がAMDにおける最も優先度が高い事業です」と述べています。
2023/9/29 AIビジョンのバイアス低減へ、ソニーとメタが新ツール
ソニーとメタの研究チームによる2つの新しい論文は、人間の豊かな多様性をより完全に捉えるために、コンピュータービジョン・システムのバイアスの測定方法を提案している。この2つの論文は、10月2日から6日にかけて開催されるコンピュータービジョン会議「ICCV(国際コンピュータービジョン会議)」で発表される予定だ。開発者はこれらのツールを、データセットの多様性をチェックし、より優れた多様性に富む人工知能(AI)訓練用データの作成に役立てることができる。さらに、生成AI(ジェネレーティブAI)によって生成される人間の画像の多様性測定にも使用できるかもしれない。
2023/9/28のピックアップ
2023/9/28 AI半導体のベンチマークはtoken/secに変わる
これまでAI半導体の性能指標は、「TOPS(Tera Operation Per Seconds)」でした。一秒間あたりに何兆回の計算ができるかという指標です。しかしこのTOPSという数値は解釈の幅が大きく、この数字だけをみて単純に「あれがいい」とか「これがいい」とは決められません。特に最近のAI半導体のアーキテクチャは、SambaNovaのような非ノイマン型のものから、Esperantoのようなスーパーコンピュータ型、テンストレントのようなヘテロジニアス型と幅広くなっています。もちろん旧来型のNVIDIAのグラフィックス向け半導体のAIへの転用という見方もあります。
2023/9/28 中国で最も人気のあるLLM「星火認知(SparkDesk)」を試してみました。
「星火認知(SparkDesk)」は中国のAI業界で非常に有名な「科大訊飛(iFLYTEK)」という会社が開発したLLMです。最近大きなアップデートしましたので、私も再度試してみました。ChatGPTよりは少し使いにくい(プロンプトは中国と英語しか理解できない、でもアウトプットは日本語に指定できる)ですが、機能は非常に多いので色々遊べます。(PPTの生成、画像の生成、認識など全部揃ってます)
2023/9/28 Azure OpenAI Service に gpt-35-turbo-instruct モデルが追加
Microsoft は 17 日、来年廃止予定の
text-davinci-003
などの Completions 系モデルの後継となるgpt-35-turbo-instruct
を追加しました。まずは米国東部、スウェーデン中部リージョンで利用可能となっており、最大トークンは 4,097 となります。gpt-35-turbo-instruct(0914)
モデルは Completions API 専用となっており、Chat Completions API では使用できません。
2023/9/28 伝説のポケモンかどうかの判断モデル爆速で作るぜ(PyCaret, fasteda)
みなさんご存知のKaggleでポケモンのデータを見つけたので遊んでみようと思います。見つけた時は何に使うデータなんだと思いましたし、今もよくわかっていません。遊びたい方は以下からどうぞ!https://www.kaggle.com/datasets/rounakbanik/pokemon
2023/9/28 「ChatGPT」がインターネットから直接知識を得るように ~近日中に全ユーザーに解放
米OpenAIは9月28日(日本時間)、「ChatGPT」の「Plus」および「Enterprise」ユーザーへブラウジング機能の提供を開始した。AIモデルが学習している2021年9月以前のデータに縛られず、インターネットから最新で権威のある情報を取得してユーザーへの回答を行うようになる。
2023/9/28 ChatGPT、Webブラウジング機能を復活 最新情報を利用可能に
OpenAIは27日(米国時間)、7月に公開を停止していた「Webブラウジング機能」を再開した。これにより、有料のChatGPT Plus(月額20ドル)とEnterpriseユーザーは、Webで公開された最新情報を使ったChatGPT利用が可能になる。ChatGPTの学習データは、2021年9月までで最新の情報は含まれていないが、WebブラウジングをONにすると、Webから取得した最新情報を回答に含められる。Webブラウジング自体は、5月にスタートしていたが、「コンテンツ所有者の権利を侵害しかねない」問題が発生し、7月に公開を停止した。
2023/9/28 ChatGPT商用利用時、規約上の注意点3つ|元ITエンジニアの弁護士が徹底解説
今回は、昨今最も多くの人が利用している生成AIのひとつであろうChatGPTを例に、ChatGPTを商用利用する場合と、それに伴う規約上の注意点について解説します。
2023/9/28 GoogleのチャットAI「Bard」で会話内容を共有するとGoogle検索に表示されてしまうことが発覚
GoogleのチャットAI「Bard」は、2023年7月のアップデートで「AIとの会話内容を共有する機能」を追加しました。この会話共有機能を使用すると、Bardとの会話がGoogle検索に**インデックス**されてしまい、全世界に公開されてしまうことが明らかになっています。
2023/9/28 Meta、対話型アシスタント「Meta AI」全面展開 情報共有・画像生成など
Metaは、27日(米国時間)に開催した「Meta Connect」において、対話型アシスタント「Meta AI」を発表した。Generative AI(生成系AI)を使ったチャットAIで、Instagram、Messenger、WhatsAppなどに搭載し、Meta AIと会話しながら画像生成や動画編集が可能になる。Meta AIは、ベータ版として提供予定で、同社の大規模言語モデル(LLM)「Llama 2」と最新のLLM研究を活用したカスタムモデルを搭載。テキストベースのチャットでは、Bingとの検索パートナーシップにより、リアルタイムの情報にアクセスし、画像生成ツールを提供する。
2023/9/28 MetaがLlama 2を基盤にしたチャットボットAI「Meta AI」を発表、スマホ・Quest 3・スマートサングラスからアクセスできて画像生成も可能
2023年9月27日・28日に開催されるMetaの新製品発表イベント「Meta Connect 2023」の基調講演で、Metaが開発する大規模言語モデル「Llama 2」をベースとするAI会話アシスタント「Meta AI」が発表されました。Meta AIはWhatsApp・Messenger・Instagramで利用できるほか、同日に発表されたMeta Quest 3やスマートグラスのRay-Ban Metaでもアクセス可能だとのことです。
2023/9/28 本当にオープンソースのライセンスで利用&検証できる大規模言語モデル「Mistral 7B」が登場、「Llama 2 13B」や「Llama 1 34B」を上回る性能のAI開発が可能
フランスのAIスタートアップであるMistral AIが開発した大規模言語モデル「Mistral 7B」が、2023年9月に登場しました。モデルの重みが**Apache 2.0ライセンス**でリリースされているので自由に調整してチャットAI開発に利用可能となっているほか、パラメーター数を73億個に抑えているにもかかわらず「Llama 2 13B」や「Llama 1 34B」などパラメーター数の大きいモデルよりもベンチマークで高いスコアを残しています。
2023/9/28 PFN、日英言語対応で世界トップレベルのLLM「プラモ」
Preferred Networks(PFN)は、130億パラメータの事前学習済み大規模言語モデル「PLaMo-13B(Preferred Language Model、プラモ)」を、研究・商用で利用可能なオープンソースソフトウェア(OSS)ライセンスで公開した。現在公開されている同規模のパラメータ数の事前学習済み言語モデルと比べ、大規模言語モデルのベンチマーク評価において、日英2言語をあわせた能力で世界トップレベルの性能を示しているという。
2023/9/28 Google Colab で Preferred Networks の PLaMo-13B を試す
「PLaMo-13B」は、「Preferred Networks」が開発した130億パラメータの日本語LLMです。
2023/9/28 PFNが生成AI新会社「Preferred Elements」設立へ 130億パラメータの和製LLMもオープンソースで公開
AIベンチャーのPreferred Networks(PFN)は9月28日、生成AI事業に関する新子会社「Preferred Elements」を11月1日に設立すると発表した。マルチモーダル(画像や言語など複数の入力ソースを扱えること)な基盤モデル(大量のデータでトレーニングし、さまざまなタスクに適応可能な大規模モデル)の開発強化が目的。
2023/9/28 「反重力」存在せず 国際チームが証明
重力と反対方向に働く「反重力」は存在しないことをカナダや欧米などの国際研究チームが実験で突き止め、英科学誌ネイチャーに論文が9月28日掲載された。反重力は50年以上前から物理学やSFで存在の可能性が議論されてきたが、精密な実験によって存在しないことを初めて証明した。
2023/9/28 物質と対の性質を持つ「反物質」が重力に従って落ちることがCERNの実験で判明して反重力が否定される
ある物質と質量や**スピンが同じにもかかわらず電気的な性質が対になっている反物質について、科学者の中には「重力と反対方向に動く反重力が働くのではないか」と考える人もいました。ところが、欧州原子核研究機構(CERN)**の研究チームが実際に反物質を用いた実験を行った結果、反物質も重力に従って落ちることが初めて直接観測され、「反物質に反重力は働かない」ことが示されました。
2023/9/28 イーロン・マスクのSpaceXが軍事版Starlinkである「Starshield」の契約をペンタゴンと締結
国防総省が、イーロン・マスク氏率いるSpaceXの軍事向け衛星プログラム「Starshield」に関する契約を同社と締結したことを明かしました。SpaceXは2023年6月にもウクライナへのStarlink提供について国防総省と契約を交わしており、今回の新プログラムにより軍事分野におけるSpaceXの役割がさらに拡大されることになります。
2023/9/28 ついに施行が始まるインボイス制度は何が利点で何が問題なのか?
日本では、適格請求書等保存方式に基づく「インボイス制度」が2023年10月1日に施行されますが、その導入については歓迎する声もある一方で批判的な意見も集まっていることが連日報じられています。インボイス制度の利点と欠点について、日本最古の英字新聞である**The Japan Times**が取り上げています。
2023/9/27のピックアップ
2023/9/27 LLMの出力から誤り(ハルシネーション)を減らす新手法『CoVe(Chain-of-Verification)』と実行プロンプト
大規模言語モデルにおけるハルシネーション(事実とは異なる誤った出力)を有意に減少させることができる手法Chain-of-Verification(CoVe)手法が発表されました。この手法は、Wikidataに基づいたリストベースの質問、長文のテキスト生成といった多様なタスクで効果を発揮しました。本記事は論文を参照し、『CoVe』の性能や、具体的なプロンプト例などを紹介します。
2023/9/27 Llama2-70b-chat on watsonxとおしゃべりする
こんにちは。ChatGPTは最高に楽しいのですが、知能レベルが変わってしまったり不適切な会話をしているとBANされてしまったりと、特に最近はLLMのセルフホスト熱が高まっています。個人的に。みんなColab使ったりローカルマシンで動かしたりしているようですが、IBMのwatsonxというサービスを使うと環境構築周りの知識ゼロでもブラウザーやAPI経由で触れるようになります。 ということで、この記事ではwatsonxのAPIを使って簡単なチャットプログラムを作る方法をご紹介します。公式クライアントモジュールを使用しませんので、この記事はPythonベースですが別の言語で試す場合にも読み替えていただけると思います。
2023/9/27 Amazon ComprehendとAmazon QuickSightを使ってテキストデータの頻出語を可視化してみる
こんにちは、洲崎です。Amazon Comprehend(以下:Comprehend)は自然言語処理(NLP)を利用したドキュメントの内容を分析することができるサービスです。Comprehendを使用すると、ドキュメント リポジトリ全体をスキャンして頻出語などを抽出することができます。AWS BlogでComprehendで抽出したデータを**Amazon QuickSight**(以下:QuickSight)で可視化する記事があったのでやってみました。https://aws.amazon.com/jp/blogs/machine-learning/visualize-an-amazon-comprehend-analysis-with-a-word-cloud-in-amazon-quicksight/
2023/9/27 Googleの独禁法違反訴訟は異例の「非公開裁判」になっているとの指摘
Microsoftが1998年にアメリカ司法省から提訴された際には、設立者であるビル・ゲイツ氏の答弁が一面記事として報じられ、世界一の大富豪が証言席でしどろもどろになる様子が衆目にさらされました。一方、2023年9月に始まった司法省対Googleの**裁判**では、裁判の経過の多くが非公開となっており、その内容を一般市民が知ることが難しくなっています。司法省が独占禁止法違反で大企業を追及した裁判という共通点を持ちながら、法廷における扱いがMicrosoftとGoogleとで大きく違う問題について、アメリカの企業問題に詳しい著作家のマット・ストーラー氏が考察しました。
2023/9/27 Amazonが規制当局と17州から独禁法違反で提訴される、「プロジェクト・ネッシー」なる謎の価格操作アルゴリズムの存在も明るみに
アメリカ連邦取引委員会(FTC)が2023年9月26日に、違法行為により競争を妨害し独占力を行使して価格をつり上げたとして、17の州の司法長官とともにAmazonを告訴したと発表しました。
2023/9/27 LangChain RetrievalQAの使い方: ChatGPTを活用した専門情報の検索
ChatGPTを利用する際、モデルに特定の情報を問い合わせたいときにどうすればよいか。この記事では、RetrievalQAという便利なツールを使って、ChatGPTを活用した情報検索方法を紹介します。
2023/9/27 Windows Copilot の使い方
「Windows Copilot」の使い方をかるくまとめました。・Welcome to Copilot in Windows
2023/9/27 Windows 11、AI統合の「Copliot」など大型アップデート
Microsoftは26日(米国時間)、AIを使った機能をWindowsに統合した「Copilot in Windows」などを含むWindows 11のアップデートを提供開始した。多くの機能更新が含まれるが、一部の機能から順次提供される。
2023/9/27 アート引越しセンター、部屋を撮影するだけで見積り算出
アート引越センターは、部屋の中をスマートフォンで撮影するだけで引っ越しの見積り算出する「引っ越しAI見積りアプリ」の開発に着手した。’24年2月の提供開始を予定している。ユーザーが室内をぐるっと撮影するだけで、AIが自動で見積り金額を算出するアプリ。撮影データを基に3Dモデルが自動で生成され、物量積算AIエンジンによって自動で見積り金額が算出される仕組みとしている。24時間自由なタイミングで部屋を撮影して、見積りを算出できる。
2023/9/27 映画の脚本をAI学習に流用する代わりに使用料を脚本家に払うことで暫定的な合意に至ったことがハリウッドのストライキ問題で明らかに
アメリカの脚本家を代表する組織である**アメリカ脚本家組合(WGA)の東西支部が映画製作者協会**(AMPTP)に対して賃金上昇や労働環境の改善、人工知能(AI)使用の規制を要求するために2023年5月から約5カ月間におよぶストライキを行っていました。現地時間の2023年9月25日、WGAはAMPTPとの間で暫定的な合意に至ったことを発表しました。
2023/9/27 洋服の青山、スマホを使って自宅でバーチャル試着 動きも再現
青山商事は、手持ちのスマホで体験できるバーチャル試着サービスを「洋服の青山」公式オンラインストアで導入する。第1弾として、表地と裏地のカラーが異なる2WAYリバーシブルコートのEC限定発売に合わせサービスを開始し、随時対象アイテムを拡充する。専用アプリをインストールすることなく利用できる試着サービス。利用方法は、商品ページに埋め込まれた「バーチャル試着」ボタンをクリックし、試着したい色やサイズを選択、身長・ウエスト・ヒップを入力後、スマホで自分の全身像を撮影する。入力情報を基に、商品のサイズ感が調整され、動きに合わせて服の裾が揺れたり、自然でなめらかな動きを再現することで、実際に試着しているような体験をEC上で提供する。
2023/9/27 Open Interpreterに別のお題を出してみた、結果、色々と使えそうだw
前回の記事では、Yahooファイナンスからデータを取得してグラフ化してみましたが、今回はGoogle Trendを使ってみます。皆さんも、Google Trendで作成したチャートをプレゼン資料に挿入したことがあるのではないでしょうか。Google Trendの操作はとても簡単なので困る事はないのですが、もし『日本語で指示するだけでGoogle Trendチャートが作成できる』となったら便利ではないですか?ということで、今回はGoogle Trendから情報を取得し、キーワードのトレンド比較に挑戦してみます。
2023/9/27 Open Interpreterのアップデート – 2023年9月26日
「Open Interpreter」の主なアップデートは、次のとおりです。・Open Interpreterをアプリに組み込むことが容易に・100以上の新しいLLMをサポート・カスタム設定ファイル・支出制限・チャットの再開
2023/9/27 ついに来たローカルAIデータ分析! Open InterpreterとAzure OpenAI Serviceで機密データも安全にハンドリング
Open Interpreterとは Pythonなどのコードを大規模言語モデル(LLM)を活用してローカルで実行できるオープンソースのツールです。Open Interpreterは特別な登録など不要です。インストールすればすぐに利用可能です。ローカルで動くため、インターネットへの接続やローカルファイルへの接続がより簡単にできそうです。今回インターネット接続は試していません。
2023/9/27 OpenAIのサム・アルトマンとiPhoneのデザイナーだったジョナサン・アイブが新AIハードウェアについて会合、ソフトバンクの孫正義も関与か
ChatGPTの開発元として知られるOpenAIのサム・アルトマンCEOと、元AppleのデザイナーでiPhoneなどを手がけたことで知られているジョナサン・アイブ氏が、新たなAIハードウェア端末の開発について話し合っていることが報じられています。
2023/9/27 「AIが人類を支配したら?」が現実味を帯びてきた件 加速する“AIアライメント”議論の現在地
「実は人類はAIに支配されていたんだ!」「な、なんだってー!?」とまではいかないものの、大規模言語モデルによる生成AIが仕事に使えるほどのパフォーマンスを見せて以降、「人類は進化するAIとどう付き合っていくべきか」という議論が本格化している。ここでキーワードとなるのが**「アライメント」(Alignment)**だ。「整列、連携、調整」といった意味で、AIの文脈では「安全のための調整」という意味合いが強い。
2023/9/27 VTuberなら知っておきたい「ゲーム配信の著作権」 ガイドラインとの正しい向き合い方は? “切り抜き動画”にも注意点
VTuberは、YouTubeなどの配信プラットフォーム上で配信活動を行っている。単なる雑談を話す、いわゆる“雑談枠”の配信であれば、前回取り上げたアバターを除き、ほとんど著作物が含まれないため、それほど問題にはならない。しかし、ゲーム配信となれば話が別だ。
2023/9/27 Bard の Bard Extentions と ダブルチェック を試す
2023年9月19日より、以下の「Bard」の新機能が利用可能になりました。・Bard Extentions・ダブルチェック https://blog.google/products/bard/google-bard-new-features-update-sept-2023/
2023/9/27 “不自然さのない”アイコラ画像を数枚の顔写真から生成するAI 韓国チームが開発
韓国のKAISTなどに所属する研究者らが発表した論文「MagiCapture: High-Resolution Multi-Concept Portrait Customization」は、複数枚の顔写真から参照スタイルに応じた合成ポートレード写真を高品質に生成するシステムを提案した研究報告である。MagiCaptureを使用することで、数枚のセルフィーから証明写真やプロフィール写真のような特定のスタイルの高品質な画像を生成できるだけでなく、任意の人の顔を使ってさまざまなスタイルの合成画像も作成できる。
2023/9/27 モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用
中国科学院などに所属する研究者らが発表した論文「DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior」は、Stable Diffusionを利用して劣化画像を高品質な画像に復元する修復フレームワークを提案した研究報告である。
2023/9/27 Apple・Intel・AMD・NVIDIA・Qualcomm・ArmのGPUから視覚データを盗んでウェブサイトに表示される個人情報を読み取る攻撃「GPU.zip」
Apple、Intel、AMD、NVIDIA、Qualcomm、Armといった主要なサプライヤー6社のGPUを対象とした攻撃「GPU.zip」を発見したと、テキサス大学オースティン校の研究者らが発表しました。この攻撃によって、他のウェブサイトで表示されるユーザー名やパスワードなど個人情報のビジュアルデータを悪意のあるウェブサイトが読み取れるようになるとのことです。
2023/9/26 LLMメッシュの紹介:生成AIアプリケーションの共通バックボーン
ますます多くの企業が生成AIの実験を行い本番環境へとデプロイしていくに従い、重要な疑問が浮かび上がって来ます:これらのアプリケーションは、企業にとって安全でスケーラブルなものなのでしょうか? LLMメッシュを活用すれば、その答えはYESとなります。LLEメッシュとは、分析チームやITチームが生成AIのモデルやサービスに安全にアクセスする方法を再構成する、生成AIアプリケーションのための共通バックボーンです。
2023/9/27 DataikuがLLMメッシュとLLMメッシュ・ローンチパートナーSnowflake、Pinecone、AI21 Labsを発表
Everyday AIのプラットフォームを提供するDataiku(https://www.dataiku.com/)は9月26日、 ニューヨークで開催中のEveryday AI Conference(https://events.dataiku.com/everyday-ai-conference-new-york)においてLLMメッシュを発表しました。LLMメッシュは、企業が大規模言語モデル(LLM)を組み込んで利用するために必須となる、効果的でスケーラブルかつセキュアなプラットフォームのニーズに対応するものです。さらに、Dataikuは、LLMメッシュ・ローンチ・パートナーとしてSnowflake、PineconeおよびAI21 Labsを発表しました。
2023/9/27 日立、生成AIベンチャーと協業模索 年末に向け事業化目指す
日立製作所が生成AIを活用したビジネス創出に向け、動きを本格化させている。同社は9月26日に、生成AI系のベンチャー企業6社を集めたピッチイベントを都内で開催した。登壇したのは、東大松尾研発ベンチャーでLLMなどを開発するELYZA(文京区)、ソフトウェアテスト自動化ツール「Jenkins」作者の川口耕介さんが率いる米Launchable、個人の人格をコピーした「パーソナル人工知能」を開発するオルツ(港区)、生データを基に個人情報流出の恐れがないデータセットを作成する豪Mostly AI、AutoML SaaSの米MoBagel、LLMを調整してAIチャットシステムを作るカサナレ(渋谷区)の6社。
2023/9/27 「逆ワクチン」が多発性硬化症などの自己免疫疾患を治療し根絶できる可能性を示す
「何を攻撃すべきか」を免疫システムに教えるワクチンとは逆に、「何を攻撃してはいけないか」を教えることで自己免疫疾患を治療できる可能性のある技術が、査読付き科学誌・Nature Biomedical Engineeringで発表されました。
2023/9/26のピックアップ
2023/9/26 OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化
OpenAIが最近リリースしたGPT-4V(ビジョン)は、従来のChatGPTが持っていたテキスト処理能力に加え、画像分析機能を備えています。この進化において、GPT-4Vは「画像処理の安全性能」と「嗜好性の学習」が強化されています。また、DALL-E3との連携においても非常に有用であると期待されます。なお、本技術によって実現される「見る」に加え、ChatGPTは「聞く」、「話す」ことができるようにもなります。(9/25より)2週間かけて、PlusユーザーはChatGPTに画像を見てもらったり音声で会話できるようになります(iOS & Android)。
2023/9/26 チャットGPTに音声で会話できる新機能、物語の読み聞かせも
米新興企業のオープンAIは25日、対話型AI(人工知能)の「チャットGPT」に音声でユーザーと会話ができる新機能が加わると発表した。 この新機能を活用すれば、家族の就寝時に物語を聞かせてもらったり、食卓での論議を決着させてもらったりすることもできるとしている。
2023/9/26 ついにChatGPTが「見る」「聞く」「話す」に対応、人間と同じように音声で会話したり写真の内容について質問したりできる
OpenAIがChatGPTに「画像の内容を判断して応答する機能」と「テキストではなく音声でコミュニケーションする機能」を追加することを発表しました。これにより「冷蔵庫の中身を見せてレシピを提案してもらう」といった視覚を伴うコミュニケーションが可能になるほか、人間と会話するように音声コミュニケーションをとることが可能となります。**ChatGPT can now see, hear, and speak https://openai.com/blog/chatgpt-can-now-see-hear-and-speak**
2023/9/25 ChatGPTのマルチモーダルな新機能
以下の記事が面白かったので、かるくまとめました。・ChatGPT can now see, hear, and speak
2023/9/25 Amazon、OpenAI競合のAnthropicに最大40億ドル投資 AWSでモデル開発
米Amazonは9月25日(現地時間)、米AI企業のAnthropicと生成AIを推進するための戦略的提携を結び、最大40億ドルを投資すると発表した。少数株主権を取得する。Anthropicは、米OpenAIの元エンジニアが2021年に創業した非公開企業。米Google、米Zoom、韓国通信大手のSK Telecomなどが出資している。7月にはOpenAIの「ChatGPT」と競合するテキスト生成AIモデル「Claude」の新版「Claude 2」をリリースした。
2023/9/26 FastAPI と Strawberry(GraphQL) が動作する諸々整ったデモアプリを作ってみた
この記事では、最近 FastAPI と Strawberry(GraphQL) に入門した私が、FastAPI と Strawberry(GraphQL) が動作する諸々整ったデモアプリを使用する(作る)方法をメモとして残します。・Strawberry に関する記事(特にサンプルコード付き)は未だあまり少ない印象を受けましたので、Strawberry について入門する方の参考になればと思います。
2023/9/26 【UiPath×OpenAI】開発者向けのプロンプトエンジニアリング① 前編 プロンプト文の原則と反復型開発
本記事は以下の講座を纏めた内容です。ChatGPT Prompt Engineering for Developers これが開発者向けのプロンプトエンジニアリングガイドです。Andrew Ng先生の「ChatGPT Prompt Engineering for Developers」コースを基に、**初心者向けのLLM開発者向けに、プロンプトの構築方法とOpenAIのAPIを使用して要約、推論、変換などの一般的な機能を実現する方法をわかりやすく紹介しています。**記事の最後に、UiPath Studioを使用して、講座でのそれぞれのテーマを実現しました。UiPath×OpenAIの開発において、この情報を活用することで、より高度な自動化ワークフローの開発を期待できます。本記事では、OpenAIを使用してプロンプト文構築の原則と手法を解説し、最後に、UiPath×OpenAIでの応用も説明します。
2023/9/26 【UiPath×OpenAI】開発者向けのプロンプトエンジニアリング② 中編 テキストの要約と推論
本記事では、OpenAIを使用してテキストの要約と推論を解説し、最後に、UiPath×OpenAIの応用も説明します。
UiPath公式サイト https://www.uipath.com/ja
世界中で多くの導入実績があるRPAツール「UiPath」。数々の世界的な賞を獲得するなど、その勢いは留まるところを知りません。日本でも代表的なRPAツールの一つに位置づけられており、導入実績はすでに1,000社を超えています。※2019年7月時点 数多くのRPAツールがある中で、これほどの支持を集めている理由とは。始め方から機能や特徴まで「UiPath」について徹底解説します。
2023/9/26 【生成AIアプリのためのベクトル検索】 ⑧ 分類問題へのLLMの適用
2022年からの生成AIの隆盛に対して、Apache Cassandraに対して、DataStaxエンジニアによりベクトル検索機能の拡張提案が提案され、DataStax社のCassandraマネージドサービスであるAstra DBで利用可能になっています。本記事シリーズは、このような動向の一環として同社から発表されたホワイトペーパーの内容に基づきます。
2023/9/26 そのコードはユーザーに価値を届けているか?少数精鋭で生産性の高い開発組織を目指す10Xの挑戦
小売業向けECプラットフォーム「Stailer」を開発するスタートアップ10Xは、創業から6年経ち、社員10名程度から現在は約120名へと急成長を遂げました。組織やプロダクトの規模が急速に拡大する中でも、開発体制やアーキテクチャの見直しを行うなど、開発環境向上のための取り組みを重ねた結果、一般社団法人日本CTO協会主催の「開発者体験が良いイメージのある企業ランキング」に、2022年から2年連続でランクインしています。組織やプロダクトの急拡大の中で、スタートアップゆえの度重なる機能追加への要望に応えながら、どのようにして良い開発者体験を実現しているのでしょうか。事前に実施した同社のエンジニアへのアンケート結果を見ながら、エンジニアリング本部長を務める小迫明弘さんにお話を聞きました。
2023/9/26 安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images powered by NVIDIA」をフォトストックサービスのGetty Imagesが発表
大手フォトストックサービスのGetty Imagesが、安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images(powered by NVIDIA)」を発表しました。Getty Imagesの画像生成AIは、Getty Imagesが所有するクリエイティブ素材とデータのみでトレーニングされているため、画像生成AIの課題となっている権利的な問題をクリアしているとのことです。
2023/9/26 商用利用が可能なAIアート用画像生成AI、EmiとManga Diffusionを無償公開
こんにちは、AI Picasso社の開発チームです。今日は、皆様に重要なお知らせがあります。AIアート用画像生成AI、Emi (Ethereal master of illustration) を商用利用可能で無償公開します。この画像生成AIは商用利用が可能であり、追加学習において無断転載画像を学習していません。Emiは以下のURLにて無料で利用することができます。https://huggingface.co/spaces/aipicasso/emi-latest-demo
2023/9/26 HuggingFace での Flash Attention 2 の使い方
以下の記事が面白かったので、かるくまとめました。・Efficient Inference on a Single GPU – Flash Attention 2
2023/9/23 Flash Attentionを使ってLLMの推論を高速・軽量化できるか?
Flash Attention(論文1, 論文2, GitHub)は計算内容が元のSDPAと同じ厳密手法でありながら、計算アルゴリズムとGPUメモリへのアクセス方法を工夫することにより、GPUメモリ(VRAM)使用量を系列長に対して線形に抑え、計算速度も速くなるという手法です。
2023/8/28 Metaのコーディング支援AI「Code Llama」に調整を加えることでOpenAIのGPT-4の性能を上回る可能性が報告される
Code LlamaはMetaが2023年7月にリリースした「Llama 2」をコード固有のデータセットでさらにトレーニングしたものです。コードの続きを生成する機能のほか、自然言語での入力を元にしたコード生成や、コードについての解説の生成などが可能です。そんなCode Llamaに対しAI開発企業である**Phindが微調整を加えたうえでテストを行いました。具体的にはCodeLlama-34BとCodeLlama-34B-Pythonに対して、それぞれ約8万件のプログラミングの問題と解決策を提示して微調整を行いました。微調整には「DeepSpeed ZeRO-3」や「Flash Attention 2」が採用され、32個ものNVIDIA A100 Tensorコア GPU**が使用されました。Phindによるとトレーニングには約3時間を要したとのこと。
2023/9/26 壁越しの文字をWi-Fiで読み取れる装置「Wiffract」 米研究者らが開発
米カリフォルニア大学サンタバーバラ校に所属する研究者らが発表した論文「Analysis of Keller Cones for RF Imaging」は、Wi-Fi信号のみを使用して壁越しの静止物体の高品質なイメージングを可能にするシステムを提案する研究報告である。この方法は、物体のエッジ(端)を読み取ることに焦点を当て、Wi-Fi信号だけを利用して壁越しのアルファベットを特定することに成功した。
2023/9/12 Wi-Fiで壁の向こうにある静止した物体を「透視」できる技術が登場
これまでにも、Wi-Fiで壁の向こうにいる人の動きを**モデル化したり、動作から人物を特定したりする技術が考案されてきましたが、動きのない物体の複雑な形状を詳細に見ることは非常に困難でした。そんな中、Wi-Fiの信号が物体の角に当たった際に発生する回折**を利用することで、壁の向こうにある静的なオブジェクトの輪郭を正確に捉えることができるようになったと、カリフォルニア大学サンタバーバラ校の研究者らが報告しました。
2023/9/26 SpotifyのPodcast、OpenAIの技術で本人の声での多言語吹き替えが可能に
スウェーデンSpotifyは9月25日(現地時間)、生成AI採用でPodcastをホスト自身の声で複数言語に吹き替える新機能「Voice Translation」を発表した。米OpenAIが同日発表した新しい音声技術と、3月リリースの音声文字起こしツール「Whisper」を採用する。
2023/9/26 Google Colab で DeepSpeed によるLLMのフルパラメータの指示チューニングを試す
「Google Colab」で「DeepSpeed」によるLLMの (LoRAではなく) フルパラメータの指示チューニング (Instruction Tuning) を試したので、まとめました。前回 Google Colab で SFTTrainer によるLLMのフルパラメータの指示チューニングを試す
2023/9/26 ウェブ開発の未来を左右するかもしれない大規模アンケート「State of HTML 2023」がスタート
ウェブ開発者を対象にHTMLの使用状況について調査するアンケートプロジェクト「State of HTML」が開始しました。このプロジェクトはGoogleと**ニジボックス**による協賛を得ており、ブラウザ開発におけるロードマップの優先順位にも影響を与えるとのことです。
2023/9/25のピックアップ
2023/9/25 RAGのGが必要か不要かに関する一考察
この記事では、上記の記事で使っているRAGについて、たまに見かける「RAGのGは不要ではないか」つまり**「生成部分は不要で、検索のみで十分」という考えについて、自分なりに考えてみた必要か不要かを判断する観点やその基準**について、大まかに記載します。(他の方の考え方を批判するものや、自分の考えた正しいことを主張するものではありません。読んだ方の判断材料が増えれば幸いです。)
2023/9/25 画像わからないデータエンジニアが画像系コンペに参加してソロ銀メダル取った話
若干釣りっぽいタイトルで恐縮です🙇♂️画像についてあまり詳しくない現職データエンジニアが、単騎で画像コンペに突っ込んでいき、どのようなプロセスでメダルを獲得するに至ったの?を共有する記事となっております。画像コンペの進め方がわからない人間がどのようにして進めていったのかを共有することで、これからコンペに参加してみたいな〜と思っている方へのモチベーション向上・後押しになれば良いなと考えております。
2023/9/25 OSSコードリーディングのすゝめ
OSSコードリーディングは、他人のコードを読むことで技術力を向上させる方法として知られています。実際にどのような良いことがあるのかをまとめました。
2023/9/25 AWS アーキテクチャ図を書くときの 公式ルールをまとめてみた
2023/9/25 ChatGPTと会話可能なTeams ChatBotを作る Functions編
この記事では、Azure OpenAI内のGPTモデルを使用したTeams ChatBotの作成方法について解説します。Teamsアプリケーションとして追加することで、Teams上で対話形式でAIを使用できます。
2023/9/25 Metaはさまざまな性格を持ったAIチャットボット「Gen AI Personas」を開発中、若者向けの「生意気なロボット」など
Metaが「Gen AI Personas」と呼ばれる生成AIを用いたチャットボットを開発していると、ウォール・ストリート・ジャーナルが報じました。Gen AI Personasは2023年9月27日から開催されるMetaの開発者イベント「Meta Connect 2023」の中で発表されるとみられています。
2023/9/25 シェアを拡大し続ける中国のAIユニコーン「iFLYTEK(科大訊飛)」。革新的な製品で見せるエドテックの未来
中国の「iFLYTEK(アイフライテック/中国語表記:科大訊飛)」という企業をご存知だろうか。中国のAIというと、バイドゥを筆頭に、テンセントやアリババやファーウェイやバイトダンスなどの企業が参入している。こうした大手IT企業とは別に、同社は古くからAI専門でやっていることで知られている。教育のオンライン化が進む中国において、AIやデジタル技術を導入したエドテックが台頭している(過去記事:「中国版のゆとり教育政策「双減」で教育はどう変わる?生き残りをかけ事業転換を迫られるスマート教育企業たち」)が、iFLYTEKは学習タブレットの分野でも売上を伸ばしている。今回は同社の製品の特長と、独創的な製品をいくつか紹介しよう。
2023/9/25 LLMを用いたLLMの自動評価について 〜可能性と注意点〜
今回は、LLM に LLM の評価そのものを行わせるという新たなアプローチ(LLM-as-a-judge)についてご紹介します。 ChatGPT の登場以降、国内外で LLM の開発競争が進行しており、モデルの重みが公開されたオープンなモデルも続々と現れています。そのような中で、新しいモデルの構築だけでなく、どのモデルが優れているかを比較検討することが今後ますます重要になると考えられます。
2023/9/25 プログラマブルな基盤を売るということ ~100年企業を目指して~
今回はローコード・開発者向けツールのマーケットに身を置く者として、ソフトウェアエンジニアの方以外にもぜひ**「プログラマブルな基盤」を作ること・売ることの面白さを知ってほしいと思い、文章を書いております。また、末尾におまけで今後ソフトウェアが商材ではなくなった時代が来ることも見越してどう備えるのが良いかの私見**をまとめてみようと思います。
2023/9/25 アマゾンとマイクロソフト、ビッグテックのAI戦略に見る「次のフェーズ」
本連載の中でも幾度も紹介してきたが、OpenAIとのパートナーシップによってマイクロソフトはいち早くこの波に乗り、他社もそれを急いで追いかけるという流れにあったように思う。そこにAmazonも追いついてきたわけだが、実際には両社がやっていることは、対象となる顧客も違えば、狙いも異なる。ただ軸には「似ている部分」もある、と筆者は感じた。今回は両社のイベントを現地で取材しながら感じたことを解説してみよう。
2023/9/25 NASA 地球に帰還のカプセルを回収 小惑星の石など中身の確認へ
2016年に打ち上げられたNASAの探査機「オシリス・レックス」は地球からおよそ3億キロ離れた小惑星「ベンヌ」に着地して、表面にある石や砂などを採取したあと、地球に向かって飛行していました。そして、24日、採取した石などが入ったカプセルを地球に帰還させるミッションが行われました。
2023/9/25 GPT-4などのLLMをエージェントとして既存ゲームシステムに導入し、NPCをAI化するツール『MindAgent』登場
近年の研究により、GPT-4などの大規模言語モデル(LLM)がゲーム内のキャラクターを操作し、人間と協力してタスクを達成できることが明らかになりました。この進歩はゲーム開発者、AI研究者、そしてゲームプレイヤーにとって画期的な出来事です。さらに興味深いことに、既存のゲームシステムにLLMエージェントを導入し、非プレイヤーキャラクター(NPC)をAI化することができるツールがMicrosoftやXboxなどの研究グループによって開発されました。本記事では下記の論文をもとに、従来のゲームシステムを向上させるツール『MindAgent』の開発を紹介します。
2023/9/24 大規模言語モデルとナレッジグラフに関する研究
2021/12/6 ナレッジグラフとは?特徴や作り方、活用法をわかりやすく解説
ナレッジグラフとは、さまざまな知識(ナレッジ)を体系的に連結し、グラフ構造で表した知識のネットワークです。自然文やSNSの投稿、音声など非構造化データの機械処理が可能で、近年AIの基盤技術として広く活用されています。本稿では、ナレッジグラフの概要と具体例や作り方、構築法をご紹介します。(公開日:2021/12/06)
2023/9/24のピックアップ
2023/9/24 AI コード支援機能をサービス、ローカルで構築して比較してみる
サービスは「Amazon CodeWhisperer」、ローカル LLM は「Code Llama」を対象に AI コード支援機能を環境から構築し、両者のメリデメを比較してみます。
2023/9/24 Google Colab で SFTTrainer によるLLMのフルパラメータのファインチューニングを試す
「Google Colab」で「SFTTrainer」によるLLMの (LoRAではなく) フルパラメータのファインチューニングを試したので、まとめました。
「SFTTrainer」は、LLMを「教師ありファインチューニング」 (SFT : Supervised Fine Tuning) で学習するためのトレーナーです。LLMの学習フレームワーク「trl」で提供されているトレーナーの1つになります。https://huggingface.co/docs/trl/sft_trainer
2023/9/23 【続】Flash Attentionを使ってLLMの推論を高速・軽量化できるか?
前回の記事Flash Attentionを使ってLLMの推論を高速・軽量化できるか?では、OptimumライブラリのBetter Transformerの機能を利用してHugging Face形式のモデルでFlash Attentionを使う方法を紹介しました。日本語LLM (ELYZA-japanese-Llama-2-7b) の推論をFlash Attentionで高速・軽量化できるかを実験したのですが、LLMの推論を高速・軽量化する別の手法のkey-value cacheの方が効果的であり、一緒に使うとFlash Attentionの効果は見えなくなるという少し残念な結果でした。その後、X(旧Twitter)で、Hugging Face Transformersから直接、公式実装のFlash Attention2を簡単に使えるようなったという情報を見かけたので早速試してみました。
2023/9/23のピックアップ
2023/9/23 Tree of Thoughts
Language modelではさまざまなタスクを解くことができるが,探索や先読み,初期の設定が重要な役割を果たすタスクなどを解くことが難しいという課題があります.ToT(Tree of Thought)ではさまざまな推論の経路を考え,選択肢を自己評価し,意思決定を行うことができます.これによりいくつかのタスクにおいての性能を向上させました.
2023/9/23 Raspberrypi pico(ラズパイピコ)を MicroPython でペリフェラル制御する。
Raspberrypi pico(ラズパイピコ)を MicroPython で動かすための、環境構築~ペリフェラル制御をまとめる。
2023/9/23 文章一行でAIがWebサイト構築、外部資金調達なしで5.4万ユーザを集めた豪Relume——NikeやDapper Labsも利用
デザインスタートアップ Relume は、AI が生成する Web サイトデザインプラットフォーム「Relume Ipsum」を開発した、数週間から1ヶ月程度かかっていた Web サイトを完成させるまでの作業負荷をわずか数分にまで軽減する。このプロダクトはローンチから1ヶ月足らずで5万人以上のユーザを集めた。
2023/9/23 RAG処理の改善: langchainでハイブリッド検索を実装してみる(勉強メモ)
こちらの記事を読んでいて、ローカル環境だけでセマンティックハイブリッド検索を自分のRAG処理に実装したいなーと思ったのが発端です。Microsoft が Azure Cognitive Search による RAG システムの定量評価結果を公表
2023/8/2 Azure Cognitive Search のベクトル検索とハイブリッド検索の比較デモネタ
Azure OpenAI Developers セミナー第2回でも語らせていただきました、Azure Cognitive Search のベクトル検索、ハイブリッド検索、セマンティックハイブリッド検索のデモネタについて紹介します。Azure Cognitive Search がベクトル検索に対応したことで、クラシカルなキーワード検索と組み合わせたハイブリッド検索が可能になりました。今回はいつもの戦国武将データセットを例に、それぞれの機能を比較していきましょう。
2023/9/23 大規模言語モデル(LLM)の実行環境をローカル(ubuntu22.04)に構築する
大規模言語モデル(LLM)関係のpythonモジュール実行環境をローカルに構築するために取り組んだ内容です。本内容の検証環境は
Windows11
上のWSL(Ubuntu 22.04.2 LTS
)になります。
2023/9/23 Python使いの皆さん、Rのキモいところをいっぱいお見せします
昨日会社のエンジニアの後輩社員にPython使いがキモいと感じるかもしれないRの文法をいっぱい見せたら、いい反応をいただいたので、Qiitaにまとめることにしました。
2023/9/22のピックアップ
2023/9/22 Writing an OS in 1,000 Lines
本書では、小さなOSをゼロから少しずつ作っていきます。OSと聞くと腰が引けるかもしれませんが、OS (特にカーネル) の基本機能は案外単純です。巨大なオープンソースソフトウェアとしてよく挙げられるLinuxでさえ、バージョン0.01はたった8413行でした。様々な要求に応えるために次第に肥大化していっただけで、当初は大変素朴な実装になっていました。本書では素朴なコンテキストスイッチ、ページング、ユーザーモード、コマンドラインシェル、ディスクデバイスドライバ、ファイルの読み書きをC言語で実装します。これだけ様々な機能が詰め込まれているのに、コードは合計でたった1000行未満です。
2023/9/22 N番煎じでXwin-LM-13B-V0.1をDatabricksで動かす
N番煎じシリーズです。下記リンク先で紹介されているXwin-LMをDatabricks上で試してみます。無料でGPT4越え!?ついに来たXwin-LM Google Colab で Xwin-LM-70B-V0.1-GPTQ を試す。今回は最初からCTranslate2で変換したモデルを使って推論します。Transformersそのままでも動くとは思います。
2023/9/22 RAGを使った社内情報を回答できる生成AIボットで業務効率化してみた
通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が(当然ながら)得られてしまいます。この問題を解決する方法として、**Retrieval Augmented Generation(以下、RAG)**という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力(プロンプト)に付け加えて渡すことで、ユーザが欲しい情報に関して回答させることができます。
DevelopersIOのRAGに関する一連の記事
2023/6/9 Retrieval Augmented Generationを改良する2つの方法
2023/6/14 OpenAIのAPIを使って自社ブログ(DevelopersIO)の記事をベクトル検索するボットをつくってみた
2023/6/27 OpenAIのAPIを使って営業資料をベクトル検索するボットをつくってみた
2023/7/10 ベクトル検索で「以外」や「数字の大小」を試してみたら難しそうだった
2023/7/16 ベクトル検索で欲しい情報が得られないときの問題点と改良方法を考えてみた
2023/8/29 【Google Cloud】Enterprise Searchで社内ドキュメントを検索してみた
2023/9/1 Google Cloud Enterprise SearchとRetrieveReadCompose方式RAGを利用して社内公式情報を全部質問できるようにしてみた
2023/9/22 既存のPyTorchモデルをAmazon SageMakerのリアルタイム推論エンドポイントにデプロイする
この記事は以下のような人を対象としています。・リアルタイム性が重視されるPyTorchの推論環境をオンプレに構築したが、AWSに移行したい人・SageMakerでトレーニングしたPyTorchモデルをSageMakerのリアルタイム推論エンドポイントにデプロイしたい人
2023/9/22 新興のJavaScriptフレームワークNueとは?公式サイトざっくりまとめ
この記事では、新興のJavaScriptフレームワークであるNueについて公式サイトの内容をざっくりまとめています。注)完全に正確な情報が知りたい方は記事内のリンクより公式サイトをご確認ください。https://nuejs.org/
2023/9/22 BLIP,BLIP-2
こんにちは、fuyu-quantです.今回はBLIP,BLIP-2の紹介になります.BLIPは2022年1月にSalesforceにより論文として発表された新しいVision Language Pre-training(画像と自然言語を使った事前学習)のフレームワークです.Image Captioning(画像からテキストを生成)やVisual question answering(画像への質問)を行うことができます.またBLIP-2はその後続の研究で学習済みのVision modelやLLMを使えるように改良しSOTAを達成しています.
2023/9/22 引き継ぎ業務には2on1が効果的な3つの理由
「2on1」は、クライアント側の2名とクラスメソッド側のファシリテーター1名が組む3人体制で、クライアントの抱える課題やテーマを中心に、効果的かつ効率的に内製化を進めていくサービスです。ファシリテーターの専門的なスキルを活かし、2人のクライアントが最大のアウトプットを得られるようサポートするものです。
2023/9/22 Microsoftが2023年9月26日のアップデートでWindows 11にAIアシスタント「Microsoft Copilot」を標準搭載することを発表
現地時間2023年9月21日に行われた発表会で、MicrosoftがWindows 11の次期大型アップデートとなるバージョン「23H2」を2023年9月26日にリリースすることを発表しました。23H2では、生成AIツールである「Microsoft Copilot」がWindows 11に標準搭載されるほか、「ペイント」アプリに生成AI機能「Cocreator」などが導入される予定です。
2023/9/22 東南アジア諸国の中央銀行と協力してデジタル決済システムをサポートする日本発のブロックチェーン企業「ソラミツ」とは?
カンボジアの中央銀行であるカンボジア国立銀行は2020年10月にデジタル通貨の「バコン」を導入し、銀行口座を持たない人々を金融システムに包摂する取り組みを進めています。そんなバコンの開発においてカンボジアの中央銀行と協力し、ベトナムやフィリピンなどの国々でも**中央銀行デジタル通貨(CBDC)の導入可能性を探る日本発のブロックチェーン企業「ソラミツ**」について、海外メディアのRest of Worldが報じています。
2023/9/22 LLMの個別の性格(人格)特性を、プロンプトで「測定」「形成」する手法
LLM(Large Language Models)は、テキストデータの大規模なデータセットから学習を行い、人間のようなテキストを生成することができます。そんなLLMは特定の人格特性を持つことが可能です。この報告は、Deep Mind、慶應義塾大学、カリフォルニア大学バークレー校、ケンブリッジ大学などの研究機関による共同研究の成果として行われました。
2023/9/22 GPT-4を使用した知的労働者のパフォーマンスは軒並み向上し、もとの成績が良くないほど顕著。※注意点あり
GPT-4を使用した知的労働者のパフォーマンスが全体的に向上し、特に「もともと成績のよくない人」が大幅にスキルを向上させたという報告があります。この驚くべき結果は、ハーバードビジネススクール、ペンシルバニア、MITなどのMBA部門とボストンコンサルティンググループ(BCG)による共同研究から得られたものです。ただし、注意すべき事実もあります。この記事では、AIを使用することで得られる利点とともに、その限界やリスクについての調査結果を詳しく解説していきます。
2023/9/21のピックアップ
2023/9/21 Streamlit をAzure App Serviceで動かす時のAPI Keyの置き場所
ただ、StreamlitってCommunity Cloudで共有するのはとても簡単なんですが、プライベートなレポジトリからは1つしかアプリを作れなくて、2つやりたいんですよ、と思っても有料プランがない。デモアプリをそれぞれ違うお客さん向けに作っておきたいなー、というとき、いきなり不便です。そしたら、Azure App Serviceで動かせますよ、という記事がQiitaにあって、初めてAzure App Serviceを使いましたが、その手順通りにしたら、かなり手軽にできました。Streamlit を Azure App Serviceで動かす!
2023/9/21 LlamaIndexをハイスペックPC不要、無課金で試す(revChatGPTを利用)
acheong08/ChatGPTを利用したLlamaIndexのCustomLLMの実装 ハイスペックPC不要、無課金でLlamaIndexが楽しめます ソースコードは下記 revChatGPT_LlamaIndex_LLM
2023/9/21 あたらしいフロントエンド開発ツール「Nue」
最終的に**ここ**にあるライブラリ・ツールがすべて実装されてNue Toolsの完成となります。これが完成したとき、Nueは完全なフロントエンド開発ツールセットとなり、Vite、Next.js、Astroなどをリプレイスする手段となるとのこと。これがNueの最終目標であり、2024年3月を目処に開発しているようです。
2023/9/21 【Salesforce × AI/ML】導入アプローチと具体的な実装方法をご紹介!
筆者らは企業の重要な情報(既存顧客情報、見込み客情報、商談情報など)を1カ所に集約し、それを展開・連携・活用できるプラットフォームであるSalesforceと、大量の情報の中から法則性や成功のカギを見つけることを得意とするAI/ML(Artificial Intelligence / Machine Learning)とは、非常に相性が良いのではないかと考えています。これらを上手く掛け合わせることができたならば、営業・マーケティング・サービスなどに大きな影響を与えるだけでなく、企業の今後を左右するような重要な意思決定にまでも大きな影響を与える可能性があると信じています。
2023/9/21 Terraformのオープンソース版フォークの名称が「OpenTofu」に決定、Linux Foundation Project化も行われる
Terraformはコードを元にインフラストラクチャを自動で構築することで、安全かつ効率的に構築、変更、バージョン管理できるようにするツールです。2014年からMozilla Public License 2.0のオープンソースソフトウェアとしてHashiCorp主導で開発されてきましたが、HashiCorpは2023年8月10日に突然Terraformのライセンスを商用利用を一部制限する**BSLに切り替える**と発表。これに反発したコミュニティによって、オープンソース版のTerraformとして「OpenTF」の開発が進められていました。
2023/9/21 Amazonが音声認識アシスタントAlexaに生成AIを導入、複雑なリクエストを処理可能に
現地時間2023年9月20日にバージニア州アーリントンにあるAmazonの第2本社で開催された発表会において、Amazonが音声認識アシスタント・Alexaに生成AIを導入し、スマートスピーカー・Echoファミリー全体のエクスペリエンスを向上させることを発表しました。
2023/9/21 ChatGPTに完全統合して会話から画像を生成できるAI「DALL-E 3」をOpenAIが発表、前世代よりテキストに忠実で安全性も向上
AI企業のOpenAIが画像生成AIの「DALL-E 3」を2023年9月20日に発表しました。DALL-E 3は大規模言語モデル・GPTをベースにしたチャットボットAI・ChatGPTと統合されているのが特徴で、2023年10月にChatGPT PlusおよびEnterpriseの顧客に提供される予定です。
2023/9/21 脳のゆらぎを取り入れて AI を安全にする 東京大学 ――深層ニューラルネットワークの隠れ層にゆらぎを導入し脆弱性を軽減――
◆人工知能の主要なモデルである深層ニューラルネットワークには、人間とは明らかに異なった 間違いをするような脆弱性があることが知られており、人工知能を社会実装する上で重要な課 題の一つである。◆脳の神経細胞を模したゆらぎを深層ニューラルネットワークに導入することで、特定のタイプの脆弱性を軽減できることを発見した。◆本研究は、脳の神経細胞のゆらぎの役割に関する新しい仮説を提唱するだけでなく、より人間の振る舞いに近い安全な人工知能を作成する上での示唆を提供する。
2023/9/21 GPT-4を上回るオープンなLLM誕生? 中国研究者らが「Xwin-LM」公開
米OpenAIの生成AI「GPT-4」を上回る性能をうたうAI「Xwin-LM」が、AIモデル共有サイト「Hugging Face」に公開されている。言語モデルのベンチマークサイト「AlpacaEval」でGPT-4を追い抜き1位を獲得したとしている。
2023/9/21 CPUを自作したりコンピューターアーキテクチャを理解するためにおすすめの本の一覧
hikaliumの独断と偏見で、積読は除いている。最近も結構新しい本が色々出ているので、それもいいかもしれないが、ある程度評価の定まった本を探したい場合に参考になれば。
2023/9/20 ローカルLLM のリリース年表
主な「ローカルLLM」のリリース年表をまとめました。
2023/9/20 Stability AI Japanにおける大規模言語モデルの研究開発
2023/9/20のピックアップ
2023/9/20 LLM革命、自動運転にも チャットで賢くなるAIドライバー
【期間限定無料公開】チャットGPTのような大規模言語モデル(LLM)をロボット工学に用いる動きが広がっている。自動運転車を開発するスタートアップ企業のウェイヴ(Wayve)は、LLMと自動運転ソフトを組み合わせることで、安全性を高められるという。
2023/9/20 最近話題の Vision-Languageモデル まとめ
「Vision-Languageモデル」は、画像とテキスト(自然言語)を組み合わせたタスクに用いられるモデルです。視覚情報とテキスト情報を組み合わせて多くの実世界の問題を解決するための強力なツールとなっています。
2023/9/20 「NVIDIA H100」を1000個以上積んだ高性能医学研究用コンピューティング・システムの構築をマーク・ザッカーバーグ夫妻が発表
マーク・ザッカーバーグ氏とその妻プリシラ・チャン氏の慈善団体が、医学研究に特化した世界最大級の非営利コンピューティング・システムに資金を提供し、構築することを発表しました。市場価格4万ドル(約590万円)のハイエンドGPU「NVIDIA H100」を1000個以上搭載したシステムになる予定で、「あらゆる病気の治療、予防、管理に役立つ画期的な新発見につながるものになる」とアナウンスされています。
2023/9/20 Google DeepMindがAI「AlphaMissense」を発表、どの遺伝子変異が有害かを予測して遺伝性疾患の原因を特定するのに役立つ可能性
最強囲碁AIの**AlphaGoやタンパク質の構造計算AIであるAlphaFoldを開発したGoogle DeepMind**が、遺伝子変異の有害性を予測するAI「AlphaMissense」を発表しました。
2023/9/20 イーロン・マスク氏のBMI企業Neuralink、初の人体治験参加者募集開始
イーロン・マスク氏が2016年に創業したBMI(Brain Machine Interface:脳マシンインタフェース)企業の米Neuralinkは9月19日(現地時間)、初の人体治験に参加する患者募集を開始するための独立審査委員会から承認を得たと発表した。6年かかる治験への参加募集を専用ページで開始した(日本からは応募できない)。
2023/9/20 【産業医が教える】ストレスによるメンタル不調の自己ケアと、雇用する企業側に求められる対策
こうしたメンタルヘルス不調の一因となるのが、知らず知らずのうちに溜まってくるストレスです。ストレスの蓄積はメンタルだけでなく、身体的な不調をもたらす原因にもなりうる。自身の心と体の健康を守るためにも、職場環境の中でどんなストレスがあり、どのようにストレスと付き合っていけばよいのか、その手法について紹介します。
2023/9/20 小さく始め、大きく育てるデータエンジニアリングのすすめ
本記事では、データ活用の基礎となるデータマートの作成のいろはを紹介します。ユーザーの業務フローを実際に早く変えたい、でも何からはじめればいいかわからないユーザーサイドのデータ整備を担う方におすすめです。
2023/9/20 AIの創造的な思考能力がついに人間の平均を上回ったとの研究結果が報告される
ChatGPTやMidjourneyなどの生成AIの登場により、多くの職業が影響を受けると**予想されているほか、AIで生成した絵画が人間の作品を差し置いてコンテストで優勝**するなど、創造性の分野でも生成AIの存在感が日増しに高まっています。そんな生成AIと人間が出したアイデアを、AIの回答が混じっているとは知らない人に評価してもらう実験を行ったところ、人間のアイデアよりAIが生成したアイデアの方が創造性のスコアが有意に高かったとの論文が発表されました。
2023/9/20 [ThinkingData] ThinkingEngineをつかって今すぐゲームのデータ分析をはじめてみる
ThinkingEngineは、ThinkingData社が提供するゲーム特化のビッグデータ分析プラットフォームで「誰でもデータアナリストになれるツール」となっています。 **https://www.thinkingdata.jp/**
2023/9/20 優秀なエンジニアの採用成功に近づける6つのステップをプロが解説!
本記事では優秀なエンジニアを採用するためやっておきたいことをステップごとに解説します。エンジニア採用を検討している、エンジニア採用で悩んでいる場合には是非参考にしていただければと思います。
2023/9/20 新卒向け「統計学の基礎」100ページ超 SaaS企業が無料で資料公開
SaaSやデータ活用支援などを手掛けるブレインパッド(東京都港区)は9月15日、同社が新卒研修で使った統計学の学習資料を公開した。統計学の基礎を解説したもので、ページ数は100ページ超。スライド公開サービス「Speakerdeck」から無料で閲覧できる。
2023/9/15 【新卒研修資料】基礎統計学 / Basic of statistics
株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。
2023/9/20 実写動画をアニメ映像に変える生成AI「Rerender A Video」 シンガポールの研究者らが開発【研究紹介】
シンガポールの南洋理工大学に所属する研究者らが開発した論文「Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation」は、画像生成の拡散モデルをビデオの編集に適応させるためのゼロショット・フレームワークを提案した研究報告である。この研究では、テキストプロンプトを使用して既存の実写映像をアニメ風に変換するなどの動画スタイル変換タスクの有効性を示している。
2023/9/20 自律言語エージェントを構築するためのフレームワーク Agents を試す
「Agents」は、自律言語エージェントを構築するためのフレームワークです。「コンフィグファイル」に自然言語で設定を記述するだけで、「言語エージェント」または「マルチエージェントシステム」をカスタマイズし、「ターミナル」「Gradio」「バックエンドサービス」にデプロイできます。
2023/4/7 自律駆動型のAIエージェントまとめ
「AIエージェント」とは、「LLM」を使用して繰り返し実行する行動を決定し、以前の行動の結果を観察することに基づいて、将来の行動を決定するシステムを意味します。
2023/9/19 ペットのネコがどこにいるかをリアルタイムで追跡可能なオープンソースのペットトラッカー「FindMyCat」
ペットのネコの位置情報をリアルタイムでチェックし、音を出して詳細な位置情報を特定したり、スマートフォンの画面上にネコの位置を矢印で表示したりすることができるというペットトラッカーが「FindMyCat」です。FindMyCatはオープンソースのペットトラッカーで、1度の充電で数カ月利用できるというバッテリー寿命の長さも特徴です。
2023/9/19 ノーベル賞 受賞有力者に日本の2人含む23人発表 英の学術会社
ことしのノーベル賞の発表が10月2日から始まるのを前に、イギリスの学術情報サービス会社が、今後、受賞が有力視される研究者として筑波大学の柳沢正史さんと川崎市産業振興財団の片岡一則さんの2人を含む23人を発表しました。
2023/9/19のピックアップ
Wi-Fiを使ってスマホの入力キーを盗むことができるそうです。
Wi-Fiを利用した技術としてはこんなものもありました。
2020/8/27 Wi-Fiの電波で壁の向こうにいる人の姿勢や動きを3Dモデル化する新技術「WiPose」が登場
2023/9/12 Wi-Fiで壁の向こうにある静止した物体を「透視」できる技術が登場
——————————
Java21では、
これまで「public static void main(String[] args)」といった複雑な記述が必要だった部分が「void main()」のように簡潔に記述できるようになります。
https://www.publickey1.jp/blog/23/java_21void_mainzgc.html
ということで、初心者でも書きやすくなっているようです。
——————————
Flash Attentionとは
Transformerアーキテクチャの中でコアとなるのが、Scaled Dot-Product Attention (SDPA)です。SDPAの解説は世にあふれているので詳細は他に譲りますが、SDPAは計算量が系列長に対して2乗で増加するので、長い系列を扱うときに計算量(特にGPUメモリ使用量)が膨大になってしまうという問題があります。
https://qiita.com/jovyan/items/11deb9d4601e4705a60d
Flash Attention(論文1, 論文2, GitHub)は計算内容が元のSDPAと同じ厳密手法でありながら、計算アルゴリズムとGPUメモリへのアクセス方法を工夫することにより、GPUメモリ(VRAM)使用量を系列長に対して線形に抑え、計算速度も速くなるという手法です。
https://qiita.com/jovyan/items/11deb9d4601e4705a60d
2023/9/19 GoogleのチャットAI「Bard」が高性能アップデート Gmailやマップ連携も
Googleは、チャットAIサービス「Bard」について、GmailなどGoogle関連サービスとの連携強化を始めとした機能追加を行なう。日本語でも利用可能で、近日中に公開される予定だ。
2023/9/19 インターネットアーカイブの画像配信標準化フレームワーク「IIIF」がサービスを正式に開始
さまざまなウェブページを保存する活動を行う非営利団体のインターネットアーカイブが、画像やオーディオファイルをサーバーからブラウザに配信する方法を標準化するフレームワーク「International Image Interoperability Framework(IIIF:国際的な画像相互運用のための枠組み)」の提供を正式に開始しました。
2017年3月に発売された任天堂のゲーム機「Nintendo Switch」について、任天堂はすでに**次世代モデルの開発を進めていることが報じられています**。この次世代モデル「Nintendo Switch 2(仮称)」について、大手ゲームメーカーのActivisionが「パワーはPS4やXbox Oneと同等」と言及していたことが明らかになりました。
2023/9/19 AIを利用して患者のがんを発見する「AR顕微鏡」をGoogleとアメリカ国防総省が開発している
Googleと**アメリカ国防総省**が共同で開発を進めている、がん腫瘍の発見をAIと拡張現実(AR)の力でサポートする「Augmented Reality Microscope(AR顕微鏡)」について海外メディアのCNBCが報じました。AR顕微鏡はまるで従来の顕微鏡のような見た目をしており、初期段階ではあるもののすでに有望な結果が出ているとのことです。
2023/9/19 メンターを始める時に考えていること
こんにちは、大前です。最近は AWS 認定インストラクター(AAI) として活動をしていますが、その前は自身の業務の傍ら色々な場面でメンターをする機会が多かったです。 社内メンバーのメンターはもちろん、時にはパートナー会社やフリーランスの方のメンターをさせていただく機会もありました。一方で、私自身は業界経験が長いわけでも、めちゃくちゃ高い技術力もコミュニケーション能力もないので、四苦八苦する事も少なくありませんでした。最近は AAI として活動しており、メンターをやる機会もめっきりなくなったため、せっかくなのでこれまでの経験をもとにメンターをするときに考えていたことや実践していたことなどをまとめてみようと思います。
2023/9/19 Microsoftに19年間勤めた元製品責任者パノス・パネイが退職、Amazonが雇用するとの見方も
Microsoftで「Surface」や「Windows 365」などを担当してきた製品責任者の**パノス・パネイ**氏が、19年にわたり勤めてきたMicrosoftを退職したことを自らのXアカウントで明らかにしました。
2023/9/19 「Adobe Acrobat」が“政府認定クラウドサービス”に
デジタル庁や総務省などで構成されるISMAP運営委員会は9月15日、米AdobeのPDF編集・閲覧ソフト「Adobe Acrobat Pro」などを、政府のクラウドサービス認定制度「政府情報システムのためのセキュリティ評価制度」(ISMAP)のリストに登録した。
2023/9/19 「Java 21」正式リリース。仮想スレッドが正式版に、入門者向けに「void main」と簡潔な記述、世代的ZGCなど新機能
オラクルはJavaの最新バージョン「Java 21」正式版を今日リリースします。Java 21は長期でセキュリティパッチやバグフィクスなどが提供されるLTS(Long Term Support:長期サポート)版です。企業向けのシステム開発などで安定したJavaのバージョンをある程度長期間使いたい場合には、このJava 21は有力な候補となるでしょう。
2023/9/19 ついに「ペイント」にレイヤー機能が追加予定&透過PNGもサポート
近年、MicrosoftはWindows標準アプリ「ペイント」の機能強化に力を入れており、2023年9月には**ワンクリックで背景を切り抜く機能**の追加が発表されています。新たに、テスト版Windowsのペイントにレイヤー機能が追加されることが発表されました。
2023/9/19 コードを読んでリポジトリ名を当てろ! プログラマ向けゲーム「GitHub-Guessr」が登場
そして、明らかにこのGeoGuessrにインスパイアされたであろうプログラマ向けのゲームが登場しました。「GitHub-Guessr」です。GitHub-Guessrは下記のようにGitHub上のパブリックリポジトリのコードの一部が表示され、それが一体どのリポジトリのコードなのかを当てるゲームです。
2023/9/19 豚の体内で“人間の臓器”の成長に成功 中国の研究者らが発表 移植用臓器不足の軽減を目指す
中国科学院などに所属する研究者らが発表した論文「Generation of a humanized mesonephros in pigs from induced pluripotent stem cells via embryo complementation」は、移植用の人間の臓器を豚の体内で育成することに成功した研究報告である。正確には、50%以上がヒト細胞で構成された初期の腎臓構造を豚の胚中で最大28日間培養できたという。将来的には、人間以外の動物で培養した人の臓器を人間に移植する未来を目指す。
2023/9/19 Wi-Fiからスマホの入力キーを盗む攻撃 他人のパスワード取得に成功 中国チームなどが発表
中国の湖南大学、シンガポールの南洋理工大学などに所属する研究者らが発表した論文「Password-Stealing without Hacking: Wi-Fi Enabled Practical Keystroke Eavesdropping」は、Wi-Fiハードウェアをハッキングすることなく、Wi-Fi経由でスマートフォンのキーストロークからパスワードを特定する攻撃を提案した研究報告である。
2023/9/19 「ムーアの法則」をさらに加速! Intelが2020年代後半に「ガラス基板」のCPUを実用化 1兆個のトランジスタの集積を目指して
Intelは9月18日、CPU製品の基板について、2020年代後半から有機素材に代わってガラス素材を採用することを発表した。「(半導体)業界が2030年以降も『ムーアの法則』を推進するため」の取り組みで、より高密度かつ高性能な半導体の実現につながるものと考えられる。
2023/9/19 LLMに自身のハルシネーション(幻覚)を「自覚」させ、減らす方法
LLMは非常に大規模なテキストデータから学習を行い、人間のようなテキストを生成することが可能です。しかし、時に「ハルシネーション(幻覚)」という問題が起こります。これはLLMが実在しない情報や参照を生成してしまう現象を指します。Microsoftとスタンフォード大学の研究者チームは、このハルシネーション現象に焦点を当てた研究を行いました。そして、LLMが生成した参照(引用文献などの情報)が幻覚かどうかを判断する方法を探求しています。
2023/9/18 オープンソースのリレーショナルデータベース「PostgreSQL」が信頼を獲得して広く利用されるようになるまでの歴史をエキスパートエンジニアが解説
PostgreSQLはオープンソースのリレーショナルデータベースで、**2022年の調査**によるとMySQLに次いで2番目に多く利用されています。そんなPostgreSQLについて、これまでどのように開発されてきてユーザーが増えていったのかという歴史をPostgreSQLのエキスパートエンジニアであるクレイグ・カースティエンスさんが解説しています。
2023/9/18 Flash Attentionを使ってLLMの推論を高速・軽量化できるか?
https://huggingface.co/blog/optimize-llm こちらのHugging Faceのブログ記事では大規模言語モデル(LLM)に関する色々な技術が紹介されているのですが、その中でHugging Face形式のモデルのattentionをFlash Attentionに置き換える簡単な方法も紹介されていたので、日本語LLMで試してみました。推論速度およびGPUメモリ消費量が改善するかを検証しています。
2023/9/18のピックアップ
2023/9/18 論文探訪:大規模言語モデルのための電子透かし (A Watermark for Large Language Models)
これは、LLM の生成テキストに電子透かしを入れる手法について書かれた論文です。ICML2023 のベストペーパーの一つに挙げられています。生成AIで作られた画像やテキストがネット上に氾濫していますが、生成AIモデルがこれらのデータを学習すると、そのモデルが生成するデータの品質が劣化したり[1]、多様性を失ったりする[2]ことが報告されています。これらを回避するには、学習データに生成AIで作られたものを除外する必要がありますが、電子透かしはその有効な手段となり得るかもしれません。
2023/9/18 人工知能が大きな脅威をもたらす可能性についてDeepMindの共同創設者が語る
かなり高度なクオリティでやりとりができる対話型チャットボットであるChatGPTの登場などにより、人工知能(AI)の発展と流行は大きく加速しています。そのようなAIの発展にどのような懸念事項があるのかについて、最強の囲碁AI「AlphaGo Zero」やタンパク質の立体構造予測AI「AlphaFold」を開発したことで知られるAI研究グループ**Google DeepMind**の共同創設者であるムスタファ・スレイマン氏が語っています。
2023/9/18 インストールごとに料金が発生する「Unity Runtime Fee」のポリシーをUnityが見直し表明
ゲームエンジン「Unity」が価格体系を変更し、ゲームがインストールされるたびに料金が発生する「Unity Runtime Fee」を導入すると発表したことに対して、ゲーム開発者から大きな反発が起きていた問題で、これらのフィードバックを受ける形で、ポリシーを見直す方針であることをUnityが明らかにしました。
2023/9/18 Pythonと互換性を保ちつつ、非常に高速に動作することで話題のMojoをGoogle Colab上で動作させる方法
Pythonのスーパーセットとして互換性を保ちながら、驚くべき速さで実行できると話題の「Mojo」をGoogle Colab上で動作させる方法について解説します。
2023/9/17のピックアップ
2023/9/17 日本語特化モデルをGoogle Colaboratoryを動かしてみた
2023年08月22日に東京大学から発表された、日本語に特化したAIモデルをGoogle Colaboratory上で動かしてみました。このモデルはhugging faceで公開されています。
2023/9/17 Yarn-Llama-2 で論文をエンベディングしてみる
2023月9月初旬に、Llama2ベースで128kトークンが利用できるYarn-Llama-2-128kモデル(以下、Yarn-llama2)が発表されました。OpenAIのAPI以外で、エンベディングによく利用されるMultilingual-e5は、512トークンが上限となっており、論文などの長文を丸ごとエンベディングをしようと思うと、上限トークン数をオーバーすることになります。本記事では、128Kトークンが利用できるYarn-llama2で、論文のエンベディングができるのか試してみます。
2023/9/17 【Python】超高精度音声認識AI Whisperをローカルインストールして使う方法
今回は、音声認識AIのWhisperをローカルインストールして、Pythonで利用する方法をご紹介していきます。OpenAIのWhisperは有料でAPI利用も出来ますが、今回は、無料でローカルインストールして使う方法をご紹介しています。
2023/9/17 ソフトウェアエンジニアにおすすめしたい本を100冊選んでみた
PdMむけの記事でこのような記事がある。「プロダクトマネージャーこそ、戦略的に読書せよ!」── 最短で成果を出すための読書地図 (1/6)|ProductZine(プロダクトジン)これのエンジニア向けの記事がないかなと思っていたがなさそうだったので作ろうと思った。しかし客観的な視点でこれがおすすめというのは難しいので自分が参考になったと思った本を家の本棚を見ながらまずは100冊リストアップしてみた。紹介する本は10年読まれていたり、近年発売のものであれば10年後にも読まれているだろうというものを選ぶようにしている。個別のプログラミング言語やフレームワークなどの本はバージョンアップに追随ができないことが多いので選んでいない。
2023/9/17 ChatGPTなどで見かけるTop PとTemperatureを雑に理解
OpenAIのAPIのパラメータやAzure OpenAIのプレイグラウンドでよく目にする「Top P」と「Temperature」の違いについて、簡単に理解したのでメモとして残す。詳しい理論などについてはこの記事では触れない。
2023/9/17 FlaskでLLMのストリームAPIサーバを作ってStreamlitで表示する on Databricks
前回、MLflowでカスタムモデルを作ってLLMを管理しました。MLflowでLLM カスタムモデルをロギングしてストリーム出力する on Databricks それを発展させて、MLflowで登録したモデルを実際のアプリ(API+UI)まで繋げてみます。
2023/9/16 ChatdollKitとChatmemoryを連携させて記憶を保持するバーチャル嫁に進化させてみた
そんなわけで、chatmemoryを解析していてふと思いました。example.pyを改造してPythonフレームワークの中に放り込んでサーバー立ててUnity側から立てたサーバーにアクセスしたら記憶を保持するバーチャル嫁が作れるのではないかと。これはもう試してみるしかないですね!
2023/9/16のピックアップ
2023/9/16 MLflowでLLM カスタムモデルをロギングしてストリーム出力する on Databricks
以前書いた下の記事の続き?です。勉強中の内容なので、間違いありましたらご指摘ください。CTranslate2で変換したLLモデルをMLflowでロギングする on Databricks
2023/9/16 話題のOpen Interpreterを使ってみた、そして、驚いたw
(あくまでの1〜2時間触ってみた個人的な感想)Open Interpreterは、導入が簡単、途中エラーが発生するも自己解決しながら動き続ける、パッと答えが出る、ですごく便利ですね。いや〜、驚いたw
2023/9/16 コンペで勉強になったことまとめ(2023年前期)
本記事は、コンペに参加する中で、勉強になった項目の個人的備忘録です。随時追加していく予定です。
2023/9/16 SIGNATE Student Cup 2023 の感想
SIGNATE Student Cup 2023に参加し、25位で銀メダルという結果でした。今回は備忘録も兼ねて、解法や初めて使ったライブラリなどまとめていきます。
2023/9/16 Databricksでllama.cppを動かしてみる
どうやらLLM界隈ではこちらがホットらしいです。https://github.com/ggerganov/llama.cpp この記事では本当に動かしたところまでなので、以下は残項目となっています。 ・Pythonバインディング
llama-cpp-python
のインストール・GPUサポート
2023/7/19 Llama.cpp で Llama 2 を試す
「Llama.cpp」はC言語で記述されたLLMのランタイムです。「Llama.cpp」の主な目標は、MacBookで4bit量子化を使用してLLAMAモデルを実行することです。
2023/7/19 Google Colab で Llama 2 を試す
「Google Colab」で「Llama 2」を試したので、まとめました。
2023/9/15のピックアップ
2023/9/15 Llama2の15倍速いDeciLMが登場!
深層学習コミュニティは、大規模言語モデル(LLM)の限界を押し広げ続ける一方で、これらのモデルの計算要件はトレーニングと推論の両方で指数関数的に増加しています。 今回は、オープンソースのLLMであるDeciLM 6Bを紹介します。DeciLM 6Bは57億のパラメータを持ち、Llama 2 7Bと比較可能な品質を維持しつつ、スループットが15倍高速です。
2023/9/15 Dashに自作htmlを組み込みたい! ~html埋め込み編~
DashはPythonだけでインタラクティブなダッシュボードが作成できるライブラリです。Pythonは書けるけどhtml/cssは詳しくない、という方でもお手軽にWeb上でグラフ描画などができます。
2023/9/15 【langchain】AgentExecutorの出力にベクトル検索のスコアを含めたい
langchainのAgentExecutorの出力に、(中間ステップで実行した)ベクトル検索のスコアを含める方法を検討しました。
2023/9/15 Open InterpreterをDev Containerで動かす
Open Interpreter 超話題ですね!「試してみたいけれど、ローカル環境で実行するのは何だか不安だし、Dockerで動かすのも何だか難しそうだし…」となっていたのですが、Dev Containerならサクッとコンテナ立ち上げられてできそう!と思って試してみました。
2023/9/15 ChatGPTのライバルと目されるGoogleのAI「Gemini」がリリース間近
AI研究者として知られるデミス・ハサビス氏が率いる、GoogleのAI開発部門・Google DeepMindが、開発中のAI「Gemini」のリリースが近づき、一部企業に初期バージョンへのアクセスを許可したことが報じられています。
2023/9/15 Admin.jsを使って面倒な管理画面をサクッと作ろう
ExpressとPrismaで動くサーバーにAdmin.jsを導入して処理をカスタマイズしてみました
2023/9/15 NTT、データを暗号化したまま処理する「秘密計算」国際標準化
NTTが研究開発を行ない標準化活動を推進してきた、データを暗号化したままで処理ができる秘密計算技術について、初の標準規格「ISO/IEC 4922-1:2023」が国際標準化機構(ISO)から発行された。さまざまなデータを共有し、他分野での利活用が進む中、機密データについては情報漏洩や不正利用の懸念から、データの共有には課題がある。その解決策として期待されているのが、データを暗号化したまま一度も復元せずに処理ができる「秘密計算技術」となる。
2023/9/15 pyautogui を使ってみた
pyautogui とは Pythonでデスクトップオートメーションを簡単に行うためのモジュールです。このモジュールを使用すると、マウスの動きやクリック、キーボードの入力など、ユーザーが普段手動で行う操作をプログラムから自動化できます。
2023/9/15 ELYZA on WSL2に必要なハードウェア資源
ELYZAはMetaのLlama2 7B版に対して追加事前学習により、日本語対応能力などを大幅向上させている。見たところHugging Faceで公開されているサンプルスクリプトはそのまま使えそうだったので、試しにそのまま実行させてみた。(当方、実はLLMやPythonの実利用は素人に近い・[Hugging Face] elyza/ELYZA-japanese-Llama-2-7b
2023/9/15 絵文字×絵文字=カオス? 「Emoji kitchen」がSNSで話題 X上では大喜利状態に
米Googleが提供する「Emoji kitchen」がSNSで話題だ。Emoji kitchenは2つの絵文字をミックスして新しい絵文字を生み出す機能。これまでAndroid向けキーボードアプリ「Gboard」で提供していたが、9月15日までにGoogle検索からも利用可能になり、X(元Twitter)ではカオスな絵文字を投稿するユーザーが相次いでいる。
2023/9/15 MLflow 2.7と新たなLLMOps機能のご紹介
Introducing MLflow 2.7 with new LLMOps capabilities | Databricks Blogの翻訳です。
2023/9/15 新しいタンパク質をアミノ酸配列から生成するAI「EvoDiff」をMicrosoft Researchが開発、タンパク質工学に大きな進展か
コンピューターサイエンスの研究所・**Microsoft Research**のチームが、新しいタンパク質を配列に基づいて生成するAI「EvoDiff」を開発しました。タンパク質の立体構造に基づいた従来のアプローチとは異なり、タンパク質のアミノ酸配列に焦点を当てているとのことで、タンパク質工学に大きな進展をもたらす可能性があります。
2023/9/15 ChatGPT活用 ニュースを“女子アナキャラ”が自動読み上げ24時間配信「ライブドアニュース24」
ライブドアは、「ライブドアニュース」の記事を基に、Chat GPTや自動音声を活用して生成したニュース原稿をキャラクターが読み上げる、24時間ニュース動画配信YouTubeチャンネル「ライブドアニュース24」β版を始めた。
2023/9/15 「人々を笑わせ、考えさせる研究」が評価される2023年度イグノーベル賞全10部門まとめ、日本人は栄養学賞で受賞
アメリカの科学誌「Improbable Research(風変わりな研究の年報)」が1991年から主催する、「笑い、そして考えさせられる研究」に対して贈られる「イグノーベル賞」の第33回(2023年度)授賞式が、日本時間の2023年9月15日7時に開催されました。特に日本人は2017年度から毎年イグノーベル賞を受賞しており、第33回でも日本人の研究者が栄養学賞を受賞しました。
2023/9/15 PostgreSQL 16がリリースされる、COPYの性能が最大300%向上などパフォーマンスの改善や論理レプリケーション機能の強化など盛りだくさんな内容
オープンソースのデータベース「PostgreSQL」のバージョン16がリリースされました。パフォーマンスの改善や論理レプリケーション機能の強化をはじめ、開発者のQOL向上やセキュリティ関連の更新など開発開始から35年経過しているとは思えない盛りだくさんな内容となっています。
2023/9/15 [速報]マイクロソフトとオラクル、「Oracle Database@Azure」発表。共同でAzure上でのOracle Exadataベースのマネージドサービスを提供
マイクロソフトとオラクルは14日(日本時間15日午前5時)、クラウドにおける協力関係を強化し、両社が共同でMicrosoft Azure上でOracle Exadataをベースとしたデータベースを提供する「Oracle Database@Azure」を発表しました(マイクロソフトの発表、オラクルの発表)。
2023/9/15 無料で大量のデータを自動で見やすいグラフなどで可視化し定期的に更新反映されるダッシュボードをオープンソースでセルフホスト可能なアプリ「Metabase」を使ってみた
さまざまなデータに対応して自動でいい感じにデータをまとめてくれる「自動探査」機能を搭載したデータ視覚化ツールが「Metabase」です。オープンソースでセルフホストも可能とのことなので、さっそく使い勝手を試してみました。
2023/9/15 「GPTの書いた文章」と「人間の書いた文章」、信頼されやすいのはどっち?検証の結果
大規模言語モデル(LLM)によって生成されたコンテンツをそのまま使用するのは、様々なリスクを引き起こす可能性があります。その理由の一つは、ハルシネーションによる誤情報が含まれることがあるためです。しかし、もしコンテンツが人間によるものかAIによるものかを判断できれば問題はありません。あるいは、人間なのかAI生成なのかに関わらず、信頼できる文章なのか否かが分かることが重要です。今回紹介する論文では、異なるユーザーインターフェイス(UI)のテキストで、人間とコンピュータが生成したコンテンツから受ける信頼性の印象を調査しています。その結果は驚くべきものでした。
2023/9/14 Open Interpreterのログ解析して、何が行われているのか確認してみた
Open Interpreter、知っていますか?凄すぎると話題の「Open Interpreter」の始め方・使い方まとめ 私はこちらの記事を見て、初めて知りました。 多少OpenAIのAPIを使ったあれこれをしていた経験があったので、この記事を読んだ時に「OpenAIとどのような通信しているんだろう」という疑問が生まれました。 なので、ログを確認して通信の内容を覗いてみようと思います。
2023/9/14 paizaというプログラミング学習サービスにてサービス利用停止処分になった話
実際に私はChatGPTの力を借りて問題を一問だけ解いたことがありました。 2023/01/28にA055:脱出ゲーム という問題をChatGPTの力を借りながら解きました。 結論としては、Paizaの転職サービスを利用停止となりました。実際に届いたメッセージ このメッセージによると、ChatGPTなどの生成AIを使用する行為は
解答へのヒント等の示唆
に該当するということでした。
2023/9/14のピックアップ
2023/9/14 アップルが“脱Lightning”をここまで引っ張った理由 iPhoneのUSB-Cは「MFi認証なし」に
AppleはなぜUSB-Cに移行することになったのか、そして、その影響はどうなるのか。米国で取材した情報も含め、考察してみたい。
2023/9/14 PhotoshopやIllustratorの生成AI「Firefly」がクレジット制を導入し有料プランでも画像生成枚数が制限されるように
画像生成AIへの注目が集まる中、PhotoshopやIllustratorなどを展開するAdobeも**著作権的にクリア**なことを特徴とする生成AI「Firefly」の開発を進めています。2023年9月13日(水)には、Fireflyの各種機能が一般公開されるとともにクレジット制の導入や商用利用の解禁が発表されました。
2023/9/14 “ハッカー体験”ボードゲーム、IPAが無料公開 攻撃者視点で防御を学ぶ 手番は「最近怪しいメールが来た人」から
情報処理推進機構(IPA)は9月13日、ハッカー視点の獲得を目指したボードゲーム「Cyber Attacker Placement」を公開した。サイバー攻撃者の視点を疑似体験することで、サイバーセキュリティ対策の重要性を学ぶのがゲームの目的。ゲームマニュアルやサイコロ、ボードなど素材一式のデータを無料でダウンロードできる。
2023/9/14 テキストで指定した音楽を自動で生成するAI「Stable Audio」が登場
画像生成AI「Stable Diffusion」の開発で知られるAI開発企業のStability AIが音楽生成AI「Stable Audio」をリリースしました。Stable Audioを使えば文章で指示するだけで音楽を生成できるとのこと。ただし、記事作成時点ではアクセス過多によって音楽生成が失敗する状況に陥っています。**音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan https://ja.stability.ai/blog/stable-audio**
2023/9/14 GPT-4で「親鸞ボット」「菩薩ボット」開発 京大「仏教対話AIの多様化に成功」
京都大学とベンチャー企業のテラバースムは9月12日、仏教の経典を学習させ、ユーザーの悩みに答えるチャットボット「親鸞ボット」「世親ボット」を開発したと発表した。米OpneAIのLLM「GPT-4」を活用。従来からの「ブッダボット」とあわせ、「仏教対話AIの多様化に成功した」としている。
2023/9/14 マイクロソフト、もしもCopilotの利用者が著作権侵害で訴えられたら、賠償金を代わりに支払うと約束。「Copilot Copyright Commitment」を発表
マイクロソフトは、同社が提供する生成AIによるさまざまな支援機能を提供する「Copilot」製品群が、著作権侵害の心配なく使えると約束する「Copilot Copyright Commitment」を発表しました(英語、日本語)
2023/9/14 ゲームエンジンUnityの「新料金システム」に人気ゲーム開発者達が激怒。『Among Us』『Cult of the Lamb』が脱Unityを検討、軋む信頼の牙城
Unity Technologiesは9月12日、ゲーム開発プラットフォーム「Unity」について、各提供プランの利用料金に加えて、ゲームのインストール数を基準とする「Unity Runtime Fee」を2024年1月1日から導入すると発表。これを受けて、Unityを利用するゲーム開発者からは困惑や不満の声が上がっている。
2023/9/14 「AIだからすごいんでしょ」を超えていけ──ヤマハが異例の“生成AIボカロ”オープンβテストに踏み切ったワケ 仕掛け人の「AI美空ひばり」開発者に聞く
ヤマハの代表的な製品の一つに歌声合成ソフト「VOCALOID」があるが、同社は8月、これに連なる新ソフト「VX-β」を発表した。これは楽譜を入力するだけで、微調整せずとも人間らしい歌声を出力する生成AIだ。名前にある通りこれはまだβ版で、同社はこれをクリエイター向けに無料公開して反応を探っている。
2023/9/12 Open Interpreterの実力は?GPT-4との連携で最新ニュース取得&ゲーム制作にチャレンジ!
2023/9/13のピックアップ
2023/9/13 算術タスクでGPT-4を圧倒的に上回るコンパクトなモデル『MathGLM』登場。やはりステップ・バイ・ステップが重要
『MathGLM』という新たなモデルが登場しました。このモデルは、特別に作成されたドリル(データセット)とステップ・バイ・ステップ戦略を採用することで、算術タスクにおいてGPT-4を圧倒的に上回る性能を示しています。アプローチとしては、複雑な算術問題を解決する際に、問題をいくつかのステップに分解し、それぞれのステップを逐次的に解決するという方法を採用しています。
2023/9/13 RAG評価ツール ragas を試す
「ragas」は、「RAG」 (Retrieval Augmented Generation) パイプラインを評価するためのフレームワークです。「RAG」は外部データを使用してLLMのコンテキストを拡張するLLMアプリケーションです。「ragas」はこのパイプラインを評価して、パフォーマンスを定量化します。https://github.com/explodinggradients/ragas
2023/9/13 Amazonが在庫・販売・配送のすべてを管理するサプライチェーン「Supply Chain by Amazon」を発表
Amazonが「在庫出荷」から「顧客への商品配達」まで、サプライチェーン全体を管理する「Supply Chain by Amazon」を発表しました。通関手続きや流通などもすべてAmazonが処理してくれて、国際発送にも対応しています。
2023/9/13 Microsoftの小型で高性能なLLM「phi-1.5」を試す
phi-1.5は、Microsoftがリリースした13億(1.3B)パラメーターのLLMです。Microsoftは6月に、phi-1を発表しており、phi-1.5はその進化版です。https://huggingface.co/microsoft/phi-1_5 たったの13億パラメーターしかないにも関わらず、常識、言語理解、論理的推論をテストするベンチマークで、100億パラメーター以下のモデルの中でほぼ最先端の性能を示すそうです。学習に「教科書品質」のデータを用いることで、少ないパラメーター数で高い性能を実現しています。phi-1.5は、安全性に関わる重要な課題を探求するために、研究コミュニティーに制限のない小規模なモデルを提供する目的でリリースされました。
2023/9/13 めちゃくちゃに出来る!LXD内でOpen Interpreterを構築してみた!
openinterpreterのデメリットとして、メインの環境で実行するとファイルの削除など、めちゃくちゃにされてしまう事があげられる。それならば、いくらめちゃくちゃにされても怖くない環境で構築すれば良い。Docker内で実行するのとは違ってVMの様な環境で実行するので自由度が高い。
2023/9/12 サイバーエージェントのGitHub Copilot導入と 開発生産性
2023/9/12 Open Interpreterを使ってデータ分析ができるかやってみる
Open Interpreterというオープンソースプロジェクトをご存知でしょうか?[OpenAI’s Code Interpreter in your terminal, running locally] というコンセプトのプロジェクトです。GitHubのリポジトリに記載されているより詳しい紹介内容は以下のようになっています。ざっくりいうとローカル環境で実行できるChatGPT Code Interpreterのようにファイルの取り扱いができるサービスです。
2023/9/13 Open Interpreter
今回はOpen Interpreterの紹介になります.すでに様々な方がOpen Interpreterについて紹介されていますが,自分の勉強のためにまとめたので共有しようと思います.機能としてはCode Interpreter(現在はAdvanced data analysis)のオープンソース版のようなものとなっており,画像生成,動画の編集,データ分析,資料作成などのプログラミングやAPIを使ってできることをほぼ全て行うことができます.
2023/9/12のピックアップ
2023/9/12 Wi-Fiで壁の向こうにある静止した物体を「透視」できる技術が登場
これまでにも、Wi-Fiで壁の向こうにいる人の動きを**モデル化したり、動作から人物を特定したりする技術が考案されてきましたが、動きのない物体の複雑な形状を詳細に見ることは非常に困難でした。そんな中、Wi-Fiの信号が物体の角に当たった際に発生する回折**を利用することで、壁の向こうにある静的なオブジェクトの輪郭を正確に捉えることができるようになったと、カリフォルニア大学サンタバーバラ校の研究者らが報告しました。
2023/9/12 Adobe、動画内の人やモノを認識し分離するビデオセグメンテーション機能「DEVA」を発表【研究紹介】
米イリノイ大学アーバナ・シャンペーン校と米Adobe Researchに所属する研究者らが発表した論文「Tracking Anything with Decoupled Video Segmentation」は、動画の中でさまざまな物や人を認識し分離するビデオセグメンテーション技術を提案した研究報告である。この技術は映像が再生されている間も追従し、物や人を分割し続けることができる。この技術のことを「DEVA」と名付けている。
2023/9/12 「Google Chrome」に“致命的”なゼロデイ脆弱性、修正アップデートが緊急公開
米Googleは9月11日(現地時間)、デスクトップ向け「Google Chrome」の安定(Stable)版をアップデートした。Windows環境にはv116.0.5845.187/.188が、Mac/Linux環境にはv116.0.5845.187が順次展開される。本バージョンでは、WebPにおけるヒープバッファオーバーフローの脆弱性(CVE-2023-4863)が修正された。深刻度は4段階中最高の「Critical」で、すでに悪用の報告がある。報告者のクレジットから察するに、先日「iOS」「iPadOS」「macOS Ventura」で修正された「ImageIO」の脆弱性と内容は同じと思われる。
2023/9/12 Apple、UI学習向けクローラーを開発 新しいスマホアプリを自動インストール、“使われ方”を自己学習
米カーネギーメロン大学や米Appleなどに所属する研究者らが発表した論文「Never-ending Learning of User Interfaces」は、アプリストアから新しいアプリを自動でインストールし、アプリ内操作を自動で行いデータを収集するとともに、モデルを継続的に自己学習させるUI(ユーザーインタフェース)学習向けクローラーを提案した研究報告である。
2023/9/12 好みのチャットbotを短い文章で作れるツール「Prompt2Model」 米カーネギーメロン大などが開発
米カーネギーメロン大学や中国の清華大学に所属する研究者らが発表した論文「Prompt2Model: Generating Deployable Models from Natural Language Instructions」は、短い文章(プロンプト)だけから、自然言語処理(NLP)モデルを自動で作り出すフレームワークを提案した研究報告である。
2023/9/12 米著作権当局、生成AI「Midjourney」で制作した優勝作品の著作権保護を拒否
米著作権局審査委員会は9月5日(現地時間)、生成AIを使って制作された芸術作品の著作権保護を拒否したと、米Reutersが6日、委員会の文書を添えて報じた。対象となったのは、昨年9月にファインアートコンテストで優勝したアーティストのジェイソン・M・アレン氏による作品「Theatre D’opera Spatial」だ。
2023/9/12 open-interpreter で Chrome の拡張機能を作る
open-interpreter とは LLM によるコード生成をローカルPCで実行できるようにしたオープンソースのソフトウェアです。公式のレポジトリ は以下にあります。 https://github.com/KillianLucas/open-interpreter コード生成がローカルでできるようになると何が嬉しいかというと、ファイルの作成からコーディングまでを一貫してLLMが行なってくれることです。
2023/9/12 LLMが巡回セールスマン問題などの最適化問題を解く〜自分自身で優れたプロンプトを作成&活用〜
Google DeepMindの最新研究によれば、Large Language Models(LLM)が最適化問題を解決する新たな手法として利用できる可能性が示されました。この研究は、自然言語を用いて最適化タスクを説明し、それに基づいてLLMが新しい解を生成するという方法を提案しています。さらに、LLMがプロンプト自体を最適化する能力も示されています。LLMはプロンプトの形式に敏感であり、意味的に類似したプロンプトでも性能が大きく異なる可能性があります。したがって、プロンプトエンジニアリングはLLMが良好なパフォーマンスを達成するために重要です。
2023/9/11 AIが見た目に対する物理的感覚を獲得。「変形しにくい容器はどっち?」などに正確に回答
AIが「見た目に対する物理的感覚」を理解することは困難でした。この壁を破らんとする研究がスタンフォード大学、DeepMind、プリンストン大学の研究チームから報告されました。研究チームはAIに「変形しにくい容器はどっち?」や「壊れやすいのはどっち?」といった問いに対して、物理的な感覚に基づいて答えられる能力を持たせることに成功しました。この結果は、AIは物体の見た目だけでなく、その物理的特性や機能も理解できるようになっていることを示しています。このような進歩は、ロボティックマニピュレーションや自動運転車の開発など、多くの分野でのAIの利用可能性を広げることになります。さらにはアフォーダンス理論(物体や環境が人間の心理に及ぼす影響についての理論)との関連性もあり、学術的にも深い議論を呼ぶものとなっています。
2023/9/11のピックアップ
2023/9/11 60以上の大規模言語モデルに19種類の質問を行うベンチマークテストの結果公開
**ChatGPTなどのチャットAIでも利用されている大規模言語モデル(LLM)を60種類以上集め、それぞれの創造性を試すような20種類の質問を行い、反応を比較するというベンチマークテストをAIツールの分析・テストサービスを提供するLLMonitor**が実施しています。
2023/9/11 ビデオ会議で「ずんだもん」になれるChrome拡張 美少女にもなれる DiscordやGoogle meetに対応
バーチャルYouTuber(VTuber)事業などを手掛けるシンガポールのHIGHBALLは9月11日(現地時間)、好きなアバターと声でビデオ通話できるChrome拡張「Vme!」を発表した。基本利用料は無料で、チャットツール「Discord」や「Google meet」で利用可能。無料版なら東北地方の応援キャラクター「ずんだもん」など3種類のアバターを選択できる。
2023/9/11 虫歯や歯垢の原因となる物質を減少させる可能性のある天然分子を発見
世界中で多くの人が虫歯や歯垢にまつわる問題に悩まされています。対策としては歯磨きやうがい、定期的な歯科検診が挙げられますが、1回で解決する問題ではありません。イスラエルのネゲヴ・ベン=グリオン大学の研究チームは四川大学およびシンガポール国立大学の共同研究により、自然界に存在する分子が、虫歯や歯垢の原因となっているバイオフィルムを90%減少させることを特定しました。この論文は査読付きでオープンアクセスの国際ジャーナル・Antibioticsに掲載されました。
2023/9/11 日本調剤とWolt、処方薬の即時配送開始 30分でデリバリー
日本調剤とWolt Japanは、Woltが提供する法人向け即時配送プラットフォーム「Wolt Drive」の活用に係るパートナーシップを締結。9月11日より、東京都および神奈川県内の18店舗で処方薬の即時配送サービスを開始する。Wolt Driveは、企業がWoltのアプリやWebサイトに店舗ページを開設することなくWoltの配達システムを利用することで、通常30分程度で顧客への配送が可能になる法人向けサービス。今回の提携により、オンライン診療やオンライン服薬指導を受けた患者、薬局へ来局した患者への処方薬の即時配送が可能となる。
2023/9/11 TSMCが「半導体不足は2024年末ごろまで続く」と指摘
材料を物理的損傷や腐食を防ぐケースに封入する半導体製造の最終工程「パッケージング」のボトルネックにより、半導体製造が大幅に遅れていることがTSMCの会長より明かされました。特にAI向けに最適化された広帯域幅の製品に影響が出ると見られています。
2023/9/11 MetaはOpenAIのGPT-4を目標として新たな対話型AIを開発しているとの報道
InstagramやFacebookなどを展開するMetaが、OpenAIの大規模言語モデル「GPT-4」に匹敵する対話型AIを作成するために、AIトレーニング用のハイエンドGPUの購入やデータセンターの構築を進めていることが報じられています。
2023/9/11 なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由”
そんな中、日本では理化学研究所と富士通、東京工業大学、東北大学が、スーパーコンピュータ「富岳」を使ったLLMの研究を今まさに進めている。学習手法の研究からデータの法的な扱いまで幅広く検討し、日本のLLM開発の基盤を作るのが目的だ。深層学習といえば、今ではGPUを使うのが一般的になっている。しかし富岳はそのGPUを搭載していない。日本にはGPU搭載スパコンも存在するのに、なぜ富岳を使ってLLMを研究するのか。
2023/9/10 Mojo入門 (2) – Mojo言語の基本
以下の記事が面白かったので、かるくまとめました。・Mojo language basics 前回 Mojo入門 (1) – 事始め
2023/9/11 Mojo入門 (3) – MojoモジュールとMojoパッケージ
以下の記事が面白かったので、かるくまとめました。・Mojo modules and packages 前回 Mojo入門 (2) – Mojo言語の基本
2023/9/11 凄すぎると話題の「Open Interpreter」の始め方・使い方まとめ
以下の記事を見て、早速「Open interpreter」を試してみたので、使い方や始め方をまとめておきます https://note.com/shi3zblog/n/n7eaba88ffe4a
2023/9/8 OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる
凄いものが出てきてしまった。ChatGPTの「Code Interpreter」が話題になったが、あれはあくまでクラウド上で動いているだけ。それを模してローカルで動作するようになった「Open Interpreter」は、衝撃的な成果である。
2023/9/11 3大クラウド(AWS,Azure,GCP)をそれぞれプロダクションで実運用した感想(その3 AWS固有の優位性について)
今年のはじめに書いた3大クラウドの比較シリーズに関して長いこと続編を書いてませんでした…。 3大クラウド(AWS,Azure,GCP)をそれぞれプロダクションで実運用した感想(その1 シェア、将来性) 3大クラウド(AWS,Azure,GCP)をそれぞれプロダクションで実運用した感想(その2 Azure固有の優位性について) 最近、知人/友人のみならず取引先からも「AWSやGCPに関して続編書かないんですか?」と言われることが増えてきたので、今回はAWSを本番運用していて感じたAWS固有の優位性について感想を述べていきます。
2023/9/11 JavaScriptランタイム「Bun 1.0」正式リリース。Windows版もまもなく登場へ
JavaScriptランタイム「Bun 1.0」正式版がリリースされました。BunはJavaScriptとTypeScriptのランタイム機能を備えるだけでなく、トランスパイラ、バンドラ、タスクランナーなど、JavaScript/TypeScriptのツールチェーンを統合したソフトウェアです。
2023/9/11 Pythonの高速なスーパーセットをうたう新言語「Mojo」、コンパイラなど公開、ローカル環境で利用可能に
Modular社はPythonの高速なスーパーセットだと同社が位置づける新言語「Mojo」をローカル環境で実行可能にする、コンパイラなどのツール群を公開しました。Modular社は、コンパイラ基盤として広く使われているLLVM、Swift言語、GoogleがAI処理のために設計したCloud TPUなどの開発に関わってきたChris Lattner氏が共同創業者兼CEOを務める企業です。その同社が5月に初めてMojoを発表した際に、MojoはAI処理を高速に実行するための言語だと説明しました。下記はMojoの動画「Product Launch 2023 Keynote」から。画面右がChris Lattner氏。
2023/9/10 「なんちゃってスクラム」に気づくためのコツ
こんにちは。株式会社InnoScouter CTOの大西(Twitter: @monarisa_masa)です。InnoScouterでは、開発手法として、スクラム開発に取り組んでいます。今回は、「なんちゃってスクラム」に気づくためのコツ、というトピックで話していきたいと思います。自分自身数年にわたり、他社の方から「スクラム開発やってる?」と聞かれたときに、「なんちゃってスクラムですかねぇ」と言い続けてきました。長らく「なんちゃって」状態だったのですが、最近個人的にそれを脱するタイミングを味わったので、その話をさせてください。
2023/9/11 【サービス復活】年25,000円でACM会員になればO’Reilly本が読み放題になる!!
昨年、惜しまれつつサポートが終了したACM会員特典のO’Reilly Online Learningの読み放題サブスクが復活しました!年間 $174 と以前よりはコストが掛かってしまうものの、それでも通常のサブスクよりも圧倒的に安いです(通常は年間$499です)
2023/9/10のピックアップ
2023/9/10 生成型AIの新時代:Amazon Bedrockの魅力と最新機能
生成型AIの世界が急速に進化する中、Amazon Web Services(AWS)が提供するAmazon Bedrockが注目を浴びています。この記事では、Amazon Bedrockの最新の機能やユースケース、そしてその魅力について詳しく解説します。
2023/9/10 Mojo言語の基本
以下の記事が面白かったので、かるくまとめました。・Mojo language basics
2023/9/10 Kaggleの「digit-recognizerコンペ」にシンプルなNNモデルで挑み高精度を出してみた。
どうもエンジニアのirohasです。日々AI開発エンジニアとして鍛錬を続けていますが、今回はKaggleの「digit-recognizerコンペ」にシンプルなNN(ニューラルネットワーク)モデルで挑み、98%越える高精度を叩き出したのでそれについての記事を書いていきます。
2023/9/9 Amazonが「AI生成テキスト」「AI生成画像」「AI翻訳テキスト」を出版する著者に対してAIの使用申告を求める
Amazonは電子書籍や紙の書籍を自費出版できるサービス「Kindle ダイレクト・パブリッシング(KDP)」を日本を含む世界中で提供しています。新たに、KDPのコンテンツガイドラインが更新され、AI生成コンテンツを含む書籍を出版する場合は申告するように求める条項が追加されました。
2023/9/9のピックアップ
2023/9/9 アイコンだけでAWSのどのサービスなのかを当てるクイズ「AWS Icon Quiz」が登場、熟練のエキスパートたちが挑戦するも死屍累々
Amazonが展開するクラウドサービスのAmazon Web Services(AWS)には**200個以上のサービス**が存在しており、その全容を把握することは難しいものです。そんなAWSのサービスについて、それぞれのサービスがどんなアイコンなのかを当てるクイズが登場しました。
2023/9/9 不安しかない「CHAdeMO」の未来 日本発のEV充電規格は、無事生き残れるのか
世界に先駆けて登場した日本発のEV充電規格「CHAdeMO」(チャデモ)に未来はあるのでしょうか。今回は、TeslaのCHAdeMOアダプターのソフトウェアアップデート(後述)をきっかけに、CHAdeMOを巡る課題について、Teslaユーザーの視点で考察します。
2023/9/9 iPS細胞の心筋球移植 “大きな副作用みられず”最新の経過発表
iPS細胞から作った心臓の筋肉を、小さな球状のかたまりにして心臓病の患者に移植する新たな治療法について、治験を進めている慶応大学発のベンチャーなどのグループが最新の経過を発表しました。移植後、半年たった2人の患者には大きな副作用はみられていないということです。
2023/9/9 scikit-FiniteDiff を使ってみる
差分法の偏微分方程式ソルバー Scikit-FiniteDiff をインストールして使い始めています。1リンク先のイントロダクションに概要が書かれています。
sympy
を使って離散化した方程式を作り、時間に対して Method of line の手法で解くとのこと。まずは、道具として使う観点で触っています。
2023/9/8 Single Domain Generalization for Object Detection (物体検出のための単一ドメイン汎化)
今回は物体検出のためのSingle Domain Generalizationについてサーベイしてみました.Single Domain Generalizationとは単一のドメインのみを学習し,未知のドメインに対しての検出性能を高めるもので,画像分類タスクにおいてはよく行われているものです.しかしながら物体検出タスクについてはまだ研究が進んでおらず,2,3本しか発表されているものがありませんでした.これから研究の余地がありそうですね!
2023/9/5 SISAP 2023 Indexing Challenge 参加記
松井研B4の小栗です。 類似度検索に関する国際会議であるSimilarity Search and Applications (SISAP 2023)にて開催された近似最近傍探索のコンペティションIndexing Challengeに参加しました。結果として、一部トラックで2位となることができました。加えて、コンペで用いた手法に関する論文がShort Paperとして採択されました。 今回はコンペの概要、参加した感想、そしてコンペで用いた手法についてお伝えします。
2023/9/4 データ分析コンペKDDCUP2023にてドコモの2チームが入賞した解法の紹介
NTTドコモ クロステック部の鈴木明作です!ドコモR&Dでは、データマイニングの世界最高峰の国際学術会議であるKDDで開催されているKDDCUPに毎年参加しており、 今年はKDDCUP2023のTask3において、ドコモの2チームが上位入賞(NTT-DOCOMO-LABS-RED 6位、NTT-DOCOMO-LABS-BLUE 9位)しました。
2023/9/2 Kaggle GrandMaster 振り返り
Kaggle GrandMaster になったら振り返りを書くという風習があるらしい。検索するとたくさん出てきてどれも面白い (yu4u さんの振り返り, and references therein.) 機械学習で競う Kaggler と一口に言ってもテーブルデータに強い人、画像に強い人、なんでも強い人、AtCoder も強くてアルゴリズムと実装に強い人などいろいろいる。私は物理に強い(そしてそれ以外はそんなにできない)人というちょっとマイナーな GrandMaster になった。
2023/8/7 人工知能学会2023ランチョンセミナー「アンサンブル学習における基礎理論の構築」
2023/9/4 大規模言語モデル
2023/9/4 コンペで使える!?LightGBMで実装する3つの弱教師あり学習
ABEJAでデータサイエンティストをしている小林です。 今回は、もしかしたらいつか業務や機械学習コンペに役立つかもしれない情報、LightGBMで弱教師あり学習を行う方法についてお話します。コードはこちらで公開しております。
2023/9/8のピックアップ
2023/9/8 mixpanelを使って優良顧客を見つける分析手法
ミックスパネラーの國崎です。今回はmixpanelを使って自社の優良顧客を見つける分析手法をお伝えします。
2022/9/13 Mixpanelのご紹介&WebサイトからMixpanelにイベントデータを送ってみた
みなさま「Mixpanel」という分析ツールはご存知でしょうか。Mixpanel はWebサイトやアプリでのユーザーの行動情報を収集し、分析できるツールです。オンライン時代の今、ユーザーの行動やプロダクトを分析することは、コンバージョンやエンゲージメント、リテンションを高める上で欠かせないものとなっています。分析対象となるリアルタイムの詳細なユーザーの行動データを収集し、セルフサービスでより簡単に分析することのできるツールがMixpanelなのです。
2023/9/8 Huaweiの「Mate 60 Pro」に韓国のSKハイニックス製メモリが搭載されていることが判明、半導体輸出規制の有効性に疑問符
Huaweiは2023年8月30日に記事作成時点で最新のスマートフォンである**「Mate 60 Pro」を発表し、アメリカ主導の厳しい半導体技術の輸出規制にもかかわらず中国の半導体メーカー・SMIC製の7nmプロセスの5Gチップを搭載していることで世界を驚かせました。そんなMate 60 Proに韓国の大手半導体メーカーであるSKハイニックス**製のメモリやフラッシュストレージなどが搭載されていることが判明し、SKハイニックスが調査を開始したと報じられています。
2023/9/8 YouTube上で直接ゲームを遊べる新機能「Playables」一部に向けテスト実装中。Googleゲーム事業の“次なる一手”か
YouTubeにて9月5日より、同サイト上でゲームを遊べる機能「Playables」が一部ユーザーに向けてテスト実装されているという。YouTubeのテスト実装中機能一覧ページにて明かされている。海外メディア9to5Googleなどが伝えている。
2023/9/8 生成AIに“視覚”与える学習ライブラリ、自動運転EVベンチャー公開 最大700億パラメータの学習済みモデルも
自動運転車の開発・販売に取り組むTuring(千葉県柏市)は9月7日、日本語などの複数言語対応のマルチモーダルな学習ライブラリ「Heron」(ヘロン、アオサギの英名)を公開した。ソースコードのライセンスはApache License 2.0で、研究・商用利用が可能。併せて、最大700億パラメータの学習済みモデル群なども公開している。
2023/9/8 任天堂がNintendo Switch後継機のデモを開発者向けに実施したとの報道
2023年8月にドイツで実施された国際的なゲーム見本市「Gamescom」で、任天堂が「次世代ゲーム機のデモ」を実施していたことが複数のメディアによって報じられています。
2023/9/8 Mojo 入門
「Mojo」は、PythonのシンプルさとRustのスピードとメモリの安全性を組み合わせた、AI開発者向けの新しいプログラミング言語です。Pythonの35000倍(PyPyは22倍、Scalar C++は5000倍)という大幅な高速化を実現しています。
2023/9/8 Open Interpreter – 自然言語でコーディングを実現するオープンソースツール
Open Interpreterは、自然言語でプログラミングができるようになる、興味深いオープンソースツールです。機能呼び出し型の大規模言語モデルを利用して、Python、JavaScript、Bashなどのコードをローカルで実行できるのが大きな特徴です。インストールと利用は簡単で、コーディング作業の効率化を図れそうなツールです。
2023/9/8 MicrosoftがAIサービスを使った顧客の著作権侵害の訴訟結果はMicrosoftが引き受けるという声明を発表
Microsoftが、AIサービス・Copilotを使用したときの著作権問題について、ユーザーではなくMicrosoftが責任を負うという約束を発表しました。
2023/9/8 [登壇レポート]「AWSトレーニングのおかげでAWS認定試験に2週連続合格できた話」というタイトルでウェビナー登壇しました
先日、「AWSトレーニングのおかげでAWS認定試験に2週連続合格できた話」というタイトルで、 AWSトレーニング・人材育成ウェビナーに登壇させていただきました。今回は登壇内容を、スライドも交えてダイジェストで紹介したいと思います。
2023/9/8 Vertex AIの生成AIでtext-bisonのファインチューニングをしてみる
おはこんハロチャオ~!何者(なにもん)なんじゃ?じょんすみすです。Vertex AIの生成AIでは、LLMのファインチューニングが可能です。 2023年9月現在、ステータスがプレビューのモデルも多いですが、text, chat, codeなどといった領域でbisonモデルが対応しています。 また、教師ありファインチューニングの他、RLHFにも対応しているようです。今回は、コンソール上からtext-bisonを教師ありファインチューニングしてみます。
2023/9/8 GANの10年にわたる歴史を振り返る〜DCGANからTransGANまで〜
今年はGenerative Adversarial Networks(GAN)が誕生してから10年目です。この10年間で、GANは画像生成からテキスト生成、さらには音声合成に至るまで、多くの進歩を遂げてきました。この記事では、その歴史的な進化を振り返り、GANがどのように多様な分野で高度な問題解決能力を持つようになったかを確認します。GANの進化は速く、毎年新しい技術やアプローチが開発されています。さまざまな分野での問題解決に貢献しており、その影響は広範囲にわたっています。
2023/9/7のピックアップ
2023/9/7 AIと人間の対話的手法により ミトコンドリア内部立体構造の可視化に成功 ―ミトコンドリア融合因子OPA1の新たな役割を発見―
◆深層学習を用いた、対話型画像解析プラットフォーム「PHILOW」を開発しました。◆優性遺伝性視神経萎縮症の発症と非常に高い関連が知られるOPA1タンパク質が、シート(ラメラ)状クリステとチューブ状クリステの量比を制御することをPHILOWによる解析によって新たに発見しました。◆本プラットフォームを用いた細胞内微細構造の迅速かつ正確な解析手法は、今後、さまざまな疾患における細胞内微細構造の解析への応用が期待されます。
2023/9/7 ソニー、“電磁波ノイズ”から発電するモジュール IoTに電力供給
ソニーセミコンダクタソリューションズ(SSS)は、電磁波ノイズエネルギーを利用したエナジーハーベスティング(環境発電)用のモジュールを開発した。エナジーハーベスティングとは、環境や生体の中に存在する微小なエネルギーを収穫(ハーベスト)し、電力に変換する技術。電波、温度差などを用いた方式が存在するが、今回開発したモジュールは、SSSがチューナー開発で培ってきた技術を応用し、「電磁波ノイズ」から電力を高効率に生成する。
2023/9/7 Google、AIで生成した政治広告に明確な開示を義務付け 11月にポリシー更新
米Googleは9月6日(現地時間)、広告ポリシーのヘルプページで、11月中旬に政治に関するコンテンツポリシーを更新すると発表した。これにより、選挙広告の広告主は、広告に合成コンテンツが含まれる場合、明確に開示する義務が生じる。
2023/9/7 LLMファインチューニングの LoRA と フルパラメータ の比較
以下の記事が面白かったので、かるくまとめました。・Fine-Tuning LLMs: LoRA or Full-Parameter? An in-depth Analysis with Llama 2
2023/9/7 AppleはAIのトレーニングに「1日あたり数億円」を費やしていると報じられる
Appleのティム・クックCEOは、同社が**独自の生成AIを開発中**であることを認めていますが、新たに「AppleはAIのトレーニングに1日あたり数億円もの大金を費やしている」と海外メディアのThe Informationが報じています。
2023/9/7 山火事を検出するためのAI技術開発でギリシャがイスラエルと協力
2023年8月にハワイ・マウイ島で発生した山火事は100人以上が亡くなる事態となりました。このほかにも各地で大規模な山火事が起きる中、「EU史上最大規模」だという山火事に悩まされるギリシャが、イスラエルと山火事を早期に検出するAI技術の開発で協力していることが報じられています。
2023/9/7 MicrosoftのLIDAをさわってみた
LLMの活用方法を探していたらMicrosoftさんが「LIDA」というLLMを使ったデータ可視化ライブラリを公開していました。https://microsoft.github.io/lida/とりあえずどのくらい使えるのか試してみたので、内容をシェアしたいと思います。試したコードは下記に置いています。
2023/9/7 多様な役割のAIエージェント達に協力してソフトウェアを開発してもらう『ChatDev』登場。論文内容&使い方を解説
ソフトウェア開発の世界では、AIエージェントの活用が着々と現実のものになりつつあります。今回新たに、「仮想のLLM駆動型ソフトウェア開発会社」というコンセプトの論文とツールが発表されました。さまざまな役割を持つエージェントたちが協力して、ソフトウェア開発の各フェーズを効率的に進めるアーキテクチャです。この画期的な研究は、Chen Qian氏らによって発表された論文「Communicative Agents for Software Development」で報告されました。北京大学などの研究グループがこのプロジェクトに関与しており、その成果はすでにGitHubで公開されています。編集部でも実際にChatDevを試してみたので、使い方を含めて解説していきます。
2023/9/6のピックアップ
2023/9/6 Windows&Docker開発環境で作ったImageをそのままAWS Lambdaにのせる方法
この記事では、ローカル環境(Windows&VSCode&Docker開発環境&Python)で開発したImageをそのままAWS Lambdaで動かせるようにする方法を載せています。例として、S3にファイルをアップロードすることを目指します。Windows環境で確認しています。未確認ですが、前提条件以外の部分は多分Macでも同じかと思ってます。
2023/9/6 あの駅が混むのは何時? 平日朝ラッシュのデータ、ヤフーが公開
ヤフーは9月6日、乗換検索アプリ「Yahoo!乗換案内」の検索データをもとに、関東・関西の8つの主要路線で、朝の通勤ラッシュの混雑時間帯情報を公開した。郊外の駅は午前6時台から混み始め、新宿・渋谷・東京など都心部は8時半前後にピークを迎えるといったことが見て取れる。
2023/9/6 Google、ChromeOSからChromeを分離する新アーキテクチャ「LaCrOS」を年内に開始
米GoogleがChromebookで採用しているChromeOSは、LinuxカーネルをベースとしたセキュアなOSにシェルとしてWebブラウザのChromeを組み込むことで、高速に起動し、しかも起動後すぐにWebアプリケーションを利用できることを大きな特徴としています。Googleは現在、このOSとWebブラウザが一体化していることを特長とするChromeOSからWebブラウザのChromeを分離する、「LaCrOS」と呼ばれる新アーキテクチャへとChromeOSを進化させようとしています。
2023/9/6 AppleがArmと2040年以降まで提携を続けることが判明、7兆6700億円規模の大型IPO案件の申請書類で
2023年9月5日、Armが新規株式公開(IPO)の手続きのために規制当局に提出した資料により、同社とAppleがチップ技術に関する提携関係を2040年以降まで延長する契約を結んでいたことがわかりました。
2023/9/6 こんなスライド資料はNG!残念な資料を伝わる資料に変えるための11のポイント【実例付き】
そこで、この記事では、クライアントや関係者へのスライド資料が、より魅力的に伝わりやすくなる資料作成のコツを失敗例とともに紹介します。読み手の心理を理解してポイントを押さえれば、グッと伝わる資料となり、相手の行動を促すことができますよ。
2023/9/6 【さくらインターネット】日本のデジタルインフラを支えるエンジニアの共通点とは【採用担当者の本音】
エンジニアの採用担当者に選考のポイントや求める人物像について尋ね、現場のリアルな声を届ける「採用担当者の本音」シリーズ。第15回は、全国3カ所のデータセンターを運営し、クラウドコンピューティングサービスやIoTサービスを展開しているさくらインターネット株式会社。
2023/9/5のピックアップ
2023/9/5 クラスメソッド データアナリティクス通信(AWSデータ分析編) – 2023年7~9月合併号
データアナリティクス事業本部 コンサルティングチームの石川です。コンサルティングチームメンバーを中心に、日々AWSのアナリティクス関連サービスのアップデートとそのブログを追っています。
2023/9/5 日本科学未来館、ノーベル賞発表の瞬間をリアルタイム配信 科学コミュニケーターの解説付き
日本科学未来館は9月5日、ノーベル賞の自然科学3賞の発表にあわせてライブ配信「科学コミュニケーターと楽しむノーベル〇〇賞」を実施すると発表した。10月2日から4日までのそれぞれ午後5時30分からニコニコ生放送とYouTube Liveで配信する。
2023/9/5 ソニー、40種類のにおいを切り替えて放出する「におい提示装置」
ソニーは、多種類のにおいを手軽に制御・提示するにおい提示装置「NOS-DX1000」の関連商品として、最大40種の嗅素をユーザー自ら注入できるカスタムカートリッジ「NOS-CK10」を12月に発売する。価格はオープンプライス。市場推定価格は17万円前後。におい提示装置本体の価格は240万円前後。
2023/9/5 イトーキ、会議室の空き状況を表示する電子ペーパーラベル
イトーキは、ワイヤレスで操作不要な予約状況表示ラベル「Workers Trail Hoteling Label」(ワーカーズ トレイル ホテリング ラベル)を10月2日に発売する。
2023/9/5 国産LLMに約8.8億円投資 AWSジャパンに狙いを聞いた
その中でも大きな影響力を持つのは、クラウドサービス大手の米AWSだろう。同社は6月、140億円の投資を発表。日本法人のAWSジャパンも、LLMの開発支援プログラムを立ち上げ、サイバーエージェントやリコー、リクルートなど17社を対象に、総額600万ドルの利用料補助や技術支援を提供していく方針を示している。
2023/9/5 グラフ構造学習を評価するためフレームワーク、米Googleが開発 4000以上のアーキテクチャを統一
米Google Researchに所属する研究者らが発表した論文「UGSL: A Unified Framework for Benchmarking Graph Structure Learning」は、グラフ構造学習のベンチマーク戦略を提案するもので、既存のいくつかの方法を単一のモデルにまとめたフレームワークに関する研究報告である。
2023/9/5 AIがチームを組み、ゲーム攻略するシステム 中国チームが開発 マインクラフトなどで実験
中国の清華大学、北京郵電大学、テンセントなどに所属する研究者らが発表した論文「AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents」は、さまざまなタスクを複数のエージェント(大規模言語モデルで駆動する自律AI)がメンバーを変えて協力して解決するシステムを提案した研究報告である。
2023/9/5 妻の歌声を合成して10年が経って、本人不在のミュージックビデオがAIでこんな感じになりました(CloseBox)
妻が遺してくれた歌声の断片から合成したUTAU音源である「妻音源とりちゃん」による最初の楽曲「ひこうき雲」をニコニコ動画で公開したのが2013年9月1日だったのです。「あれから10年が過ぎたのだなあ」と感慨に浸るのも忘れてやっていたことといえば、やはりAI妻音源による楽曲と生成AIによるミュージックビデオ制作でした。土日はずっとこれにかかりきり。
2023/9/5 数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』
科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。Nougatは、数式や文章が複雑に配置された画像であっても、それをマークアップ言語に高品質で変換する能力を持っています。この技術は、新しい論文だけでなく、電子データが存在しない古い書類などの解析にも非常に有用です。
2023/9/4のピックアップ
2023/9/4 AWSのLLM開発支援、採択企業が明らかに サイバーエージェント、マネフォ、PFN、rinna、リコーなど
AWSジャパンは9月4日、7月に発表した大規模言語モデル(LLM)開発支援プログラムについて、参加企業を一部発表した。応募があった約60社のうち、サイバーエージェント、rinna、Preferred Networks、リコー、マネーフォワード、松尾研究所など17社を採択。今後、総額600万ドル規模の利用料補助や、技術支援などを提供する。
2023/9/4 Google Cloud資格受ける前に必読 :Professional Machine Learning Engineerを受ける上で知っておいた方が良いこと
皆さんこんにちは!iret Global Solutions 事業部の浜田です。今回は僕が特に苦戦したProfessional Machine Learning Engineerを受けるにあたって知っておきたかったことを記事にしてみました。もう直ぐベータ版が出るようなので是非活用してみてください。
2023/9/4 AWSのセキュリティ管理をPolicy as Codeで加速する ― 最高のCSPM体験を目指して / Unleashing Policy as Code on AWS CSPM
「開発者体験の維持・向上」と「AWS セキュリティ/コンプライアンスの強化」の両軸をどう進めていくか、という問いは、成長する多くの技術組織を悩ませています。本セッションでは、AWSリソースの利用様態の監視・設定のセキュリティレビューといったCloud Security Posture Management (CSPM) のプロセスにPolicy as Codeを適用し、高い開発者体験でAWSに関するセキュリティ施策を推進する方法を紹介します。
2023/9/4 最近のLLMの学習法のまとめ – SFT・RLHF・RAG
最近のLLMの学習法 (SFT・RLHF・RAG) をまとめました。
2023/9/3 AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた
画像生成AIにイラストや写真を学習させることを防ぐため、「Mist」などを使って画像に敵対的サンプルと呼ばれるノイズを入れる方法があります。この敵対的サンプルによるノイズを画像から除去するためのツール「AdverseCleaner」が登場しています。
2023/9/3のピックアップ
2023/9/3 LlamaIndex の VectorIndexAutoRetriever を試す
「LlamaIndex」の「VectorIndexAutoRetriever」を試したので、まとめました。
2023/9/3 Llama2-70b-chat をAPI利用して、簡単にLLMを体験してみよう
本記事は、Llama2 のチャットボットをAPI利用して動作させるまでに必要なことをまとめたものである。動作させるまでを記載した記事であり、その後の詳細な利用法等については記していない点を留意してほしい。
2023/9/3のピックアップ
2023/9/3 LlamaIndex の VectorIndexAutoRetriever を試す
「LlamaIndex」の「VectorIndexAutoRetriever」を試したので、まとめました。
2023/9/3 Llama2-70b-chat をAPI利用して、簡単にLLMを体験してみよう
本記事は、Llama2 のチャットボットをAPI利用して動作させるまでに必要なことをまとめたものである。動作させるまでを記載した記事であり、その後の詳細な利用法等については記していない点を留意してほしい。
2023/9/2のピックアップ
2023/9/2 [セッションレポート][ANA211] BigQueryとPaLMによる次世代のデータ分析の到来に備えよう! #GoolgeCloudNext
BigQuery StudioやBigQuery DataFramesなどBigQueryの新しいインターフェースに加え、PaLMを使った次世代のデータ分析をいち早く学べるセッションでした!
2023/9/2 pythonのmultiprocessを使用する際の注意点
Pythonの
multiprocessing
を使用する際、コードをif __name__ == "__main__":
ブロック内に配置する方がよいです。主に次の2つの理由からです:
2023/9/2 キューを使ったマルチプロセス処理
業務でmultiprocessingのQueueを使用して並列処理を実装することがあったのでノウハウ記録用に記入にします。誰かのお役に立てれば幸いです。
2023/9/2 ニューラルネットワークの予測の不確実性(Monte Carlo dropout・概要編)
Monte Carlo dropoutで予測の不確実性を算出する手法の概要を説明します。
2023/9/2 [登壇資料] AWS認定の勉強方法というタイトルで登壇しました #jawsug #jawsugoita
**AWS認定トレーニング**講師の平野@おんせん県おおいたです。JAWS-UGおおいた勉強会で登壇しましたので、資料を共有します。
2023/9/2 geopandasで読み込んだシェープファイルを使ってfoliumで地図を描く
前回 geopandasを使えば簡単にシェープファイルを扱えるよという記事を投稿したけど、ただ白地図を描いてるだけじゃツマラナイと思い色々試してみました。やってみようとしたのはハザードマップを作ること。ほとんどの自治体がホームページなどでハザードマップを公開しているけれど、その殆どがPDFファイルだったり機能もりもりな地図表示サービスだったりで使い勝手はいまいちだとずっと思ってました。なので簡単にスマホやPCで気やすく見られるモノを作れないかってやってみたわけです。
2023/9/2 LlamaIndex の SentenceWindowNodeParser を試す
「LlamaIndex」の「SentenceWindowNodeParser」を試したので、まとめました。
2023/9/2 Lenovo、ゲーム端末やスマートフォンで使えるスマートグラス「Legion Glasses」10月発売
中国Lenovoは9月1日(中央ヨーロッパ時間)、ベルリンで開催の「IFA 2023」に合わせ、ゲーム端末やスマートフォン、PCと接続して仮想ディスプレイを提供するスマートグラス「Legion Glasses」を発表した。欧州では10月に499ユーロ(約8万円)で発売する。欧州以外での発売については未発表だ。
2023/9/2 渋谷を歩くだけで年齢から行動、服のブランドまで筒抜け? “AIカメラ100台設置プロジェクト”が物議
年齢や同伴者、服装、渋谷での行動内容まで、データをリアルタイムで蓄積──渋谷駅周辺にAI100台を設置するプロジェクト「渋谷100台プロジェクト」のWebサイトにあるとある記述が、8月31日ごろからX(Twitter)上で物議を醸している。
2023/9/1のピックアップ
2023/9/1 先端半導体国産化へ 「Rapidus(ラピダス)」新工場 起工式
国の支援のもと、先端半導体の国産化を目指す「Rapidus(ラピダス)」は、北海道千歳市に建設する新工場の起工式を行い、4年後の量産化に向けて本格的に始動しました。
2023/9/1 ベクトルデータベースについて備忘録
ベクトルデータベースなるものの存在を知り、どんなものがあるのかを少しだけ調べてみました。
2023/9/1 ZamaAI が開発するTFHEのアプリケーションライブラリ、concrete-mlのチュートリアルを動かす
準同型暗号とは、暗号の中でも、暗号化した後に計算をすることのできる暗号のことです。今回は、その準同型暗号の中でも、格子暗号と呼ばれる暗号の研究開発をしているZamaAIというスタートアップ企業のライブラリ、concrete-mlについて、チュートリアルを動かすことで・チュートリアルでどのようなことをやっているか(やれるのか)・どのくらいの時間で実行できるのか について解説したいと思います。このライブラリを使うと、準同型暗号のみを、秘密計算の手法として用いた機械学習の推論が実行できます。
2023/9/1 読み書き困難な人に「じぶんフォント」が有効 DNPと東工大
大日本印刷と東京工業大学等は、読み書き困難がある人にも見やすく・読みやすい「じぶんフォント」を2022年より開発しており、有効性が確認できたことを発表した。じぶんフォントは、発達性ディスレクシアを含む読み書き困難がある人にも見やすく・読みやすいフォント。多様な読み書き特性を持つ人を包括する読字環境の開発を見据えている。
2023/9/1 Metaが高性能映像処理モデル「DINOv2」のライセンスを更新して商用利用が可能に、同時にモデルの「公平性」を評価するためのデータセット「FACET」も公開へ
Metaが2023年8月31日に、映像処理モデル「DINOv2」のライセンスを**CC BY-NC 4.0からApache License 2.0**に変更すると発表しました。これまで存在していた商用利用に関する制限が取り払われ、より自由にモデルを利用することが可能になっています。同時に、モデルの公平性を評価するためのデータセット「FACET」もリリースされました。
2023/9/1 人間とAIがドローン操縦で勝負 AIが勝利 スイスなど研究チーム
世界トップクラスの操縦技術を持つ人間と、AI=人工知能が、決められたコースでドローンを操縦しどちらが早くゴールできるか勝負したところ、AIが勝利したという研究がこのほど発表されました。この研究はスイスなどの研究チームが8月30日、科学雑誌の「ネイチャー」に発表しました。研究チームは世界トップクラスの操縦技術を持つ3人の人間と、ドローンを自動操縦するAIシステムが、決められたコースでドローンを飛ばして、どちらが早くゴールできるか、1対1の勝負を行いました。結果はAIの5勝4敗、4勝3敗、6勝3敗となり、AIに軍配が上がったということです。
2023/9/1 PaLM APIが日本語に対応:機能、精度、利用方法の評価
こんにちは、京セラコミュニケーションシステム 森田 (@kccs_kai-morita)です。現在世界中が大生成AI時代に突入し、各企業が競い合っている戦国時代のような状況です。その中でも、Googleでは「PaLM2」という大規模言語モデルが発表されています。残念ながら、長らく日本語には対応していませんでしたが、先日、日本語対応が実施されたとの発表がありました1。そこで、早速その機能を試してみました。
2023/9/1 AI機能搭載Pythonライブラリ、PandasAIとAzure OpenAIでデータ分析を楽しく!機密性の高いデータも安心分析
データに対して、自然言語により質問をすることができるようになるライブラリです。本記事ではこのPandasAIと、高度なセキュリティ機能を備えたAzure OpenAI Serviceを組み合わせたデータ分析についてデモ画面を交えてご紹介します。(ここでは既にMicrosoft社のAzure OpenAI Serviceを契約されていて、また、少しPythonコードが読める方をイメージして書かせていただいていますが、ざっと眺めるだけでももちろん結構です。まだ、ご存じない方に「こんなライブラリがあるのか」と知って頂ければ幸いです。)
2023/9/1 LINEで公的個人認証、民間企業にも対応。金融やギグワークで本人確認
LINE Payは、LINEとマイナンバーカードを用いた「LINE Pay 公的個人認証サービス」において、民間企業からの申し込み受付を専用サイトにて開始する。これにより、口座開設などの民間企業のサービスで、LINEを使って簡単・確実でスピーディな本人確認を可能とする。
2023/9/1 生成AIの自社ルールの作り方 米AP通信の例 「“何をさせないか”を明らかに」
生成AIの普及により、自らのビジネスにおいても、この新しい技術を活用しようとする企業が増えている。それに伴い、社内のユーザーに向け、自社独自のガイドラインやルールを制定する動きも見られるようになってきた。ではそうしたルールがどのような内容になっているのか。大手通信社の米AP通信の例を見てみよう。
2023/9/1 データ分析の敵“汚いデータ” やらかす人への対策、どうすればいい?
BIツールの価格が劇的に低下し、事業の担当者でもツールに触れられるような時代になってきた。「Tableau」や「Microsoft Power BI」のようなBIツールを使えば、データを直感的な操作で可視化できる。ただし、その前提となるデータの記述や加工の段階で、データ処理初心者がやってしまいがちな“落とし穴”がある。パシフィコ横浜で8月23日から25日にかけて開催されたゲーム開発に携わるITエンジニアやデータサイエンティストが集まるカンファレンス「CEDEC 2023」では、データ分析に携わることになった初心者向けに、データ記述やデータ加工の悪例と、その対策を解説する講演が開かれた。
2023/9/1 コード専用生成AI「WizardCoder」、米Microsoftが公開 ベースはCode Llama、高い精度を達成
米Microsoftなどに所属する研究者らは、米Metaが最近リリースしたCode LLM(コーディング専用大規模言語モデル)「Code Llama」をベースにしたコード専用生成AI「WizardCoder」を発表した。LLMの性能を評価するベンチマーク「HumanEval Benchmark」で、ChatGPT(GPT-3.5)やClaude2を上回る高い精度73.2%を達成し、存在感を示した。唯一下回ったのは、8月26日に同研究者らが計測したGPT-4(82.0%)のみ。ただし、3月に米OpenAIの公式テクニカルレポートが報告したGPT-4の数値67.0は上回っている。あくまでHumanEval Benchmarkによるものであることは留意したい。
2023/9/1 「心の理論」においてGPT-3は人間の3歳、GPT-4は人間の7歳(基本の概念を理解しているレベル)に相当するとの研究報告
スタンフォード大学の研究者による最新の研究が、大規模言語モデル(LLM)における「心の理論(Theory of Mind, ToM)」の能力について注目を集めています。この研究によれば、GPT-3は人間の3歳児に、そして驚くべきことにGPT-4は人間の7歳児に匹敵する「心の理論」の能力を持っているとされています。この研究は、LLMが「心の理論」の能力を自然に獲得している可能性を示しています。GPT-4は90%の「偽信念タスク(詳細は後述)」で成功したと報告されています。「心の理論」は、他者の心の状態、つまり信念や意図、欲望などを理解する能力です。この能力は人間の社会的相互作用やコミュニケーションに不可欠であり、AIがこの能力を持つかどうかは長らくの疑問でした。この研究は、その疑問に現状提供できる一定の答えを提供しています。
コメント