2023年7月のおもしろいIT・AI・科学記事ピックアップ

はじめに
特に気になった記事
テーマ別気になった記事

はじめに

おもしろいな！と思った記事をピックアップしてみました。

1ヶ月分をまとめてみてみると、変化がわかって面白いですね。

毎月こんなふうにまとめをつくれたらいいなと思っています。

記事のチェックは主にReederというRSSリーダーを使っています。

Reeder

URLでサイトを登録しておくと、更新された記事がまとめて読めるようになります。

★をつけておくと後からチェックしやすいです。

あとはTwitterもチェックしています。マスク体制になって運営に不安があるので、本当は他のSNSに避難したいのですが、人が移動しないと意味がないんですよね…難しいところ。

特に気になった記事

2023/7/10 グラフニューラルネットワーク(GNN)徹底解説！用途と仕組みからPyGでの実装まで

この記事では、グラフについて知らない方でも分かるように、最初にGNNが何に使えるのかの話を中心に解説した後、実際の仕組みを知りたい方向けにモデルの紹介や様々なトピックについて網羅的に解説します！また、最後に PyTorch Geometric(PyG) を利用した実装方法についても触れます。

論文からの数式や図が多く、かなり本格的な入門っぽい。

グラフネットワークは、ソーシャルネットワークや、化学反応の予測（化学結合ってグラフですよね）、レコメンドシステムなどさまざまな分野で利用されているみたいです。これはちゃんと勉強したい！

2023/7/9 従来の大規模言語モデルの制約だった「入力量の限界」を取り払った「RWKV」は一体どんな言語モデルなのか？

ChatGPTやBardなど、2023年7月時点で商用利用されている大規模言語モデルはほとんど全てがトランスフォーマーというアーキテクチャを利用したモデルですが、トランスフォーマー型のモデルは入力の長さの2乗に比例して計算量が増加するため、入力サイズが制限されてしまう問題があります。そうした問題に応えて、大きいデータへの対応や推論時のメモリ使用量の削減を達成しつつトランスフォーマー型に匹敵する性能を出せるアーキテクチャ「RWKV」について、著者の一人がブログで解説しています。

RWKVはトランスフォーマー同様に入力トークンを同時に処理することで並列化を可能にしつつ、RNNのように長大な入力を行っても高速に計算することも可能という「両者のいいとこ取り」をしたアーキテクチャとのこと。下図の通りの構造を持っており、「Time Mixing」ブロックと「Channel Mixing」ブロックに分かれているのが特徴です。このアーキテクチャの「RWKV」という名前は、過去の情報の受容度を表すRベクトルや時間係数を表すWベクトル、そしてアテンションで使用される「Key」「Value」と同様のベクトルが利用されているところから、それぞれの頭文字を取って名付けられています。

Transformer最強かと思いきや、他のアルゴリズムも考えられているんですね〜ちゃんと技術の進歩についていきたい。

2023/7/10 GPT-4よりも高い性能を発揮できる特定言語特化型の言語モデル「InternLM」

InternLMは上海AI研究所や複数の大学および企業が協力して開発した言語モデルで、1兆トークン以上の多言語データでトレーニングされています。InternLMの主な特徴は以下の通り。

・複数の言語を理解および表現する能力を備えており、特に英語と中国において顕著なパフォーマンスを発揮する。

・論理的推論、コード生成などの分野で優れた性能を発揮する。

・多様な中国語の性能評価テストでChatGPTを超え、GPT-4に近いに性能を発揮する。

英語と中国語に特化して、ChatGPTを超える性能を発揮するモデルのようです。うーんこういうときに利用者が少ない言語が母語だと困りますね…まあ、英語や中国語で出力して、それを翻訳して貰えばいいのかもしれませんが。

2023/7/10 ChatGPT公式プラグイン「Code interpreter」を活用するためのTips

せっかく課金しているのに、全然使いこなせていないのでいろいろ試してみたい。

2023/7/12 OpenAIがShutterstockとの提携範囲を拡大し画像・映像・音楽・メタデータへのアクセス可能に

チャットAI「ChatGPT」や画像生成AI「DALL・E」の開発で知られるOpenAIとフォトストックサービス・Shutterstockが、2021年から続く戦略的パートナーシップの範囲を今後6年間拡大することを発表しました。

OpenAIの画像生成サービスDALL・Eがもっとパワーアップするかも。従量課金制なのが使いにくいんですけど、圧倒的なクオリティを実現できれば、話が変わってくるかもしれない。

2023/7/21 米Microsoftら、“コーディング専用”大規模言語モデル「WizardCoder」開発　文章から高品質なコード出力

この研究では、命令データを自動生成する「Evol-Instruct」をコードのドメインに適応させることで、複雑な命令の微調整でCode LLMを強化する「WizardCoder」を提案する。コード固有のEvol-Instructを通して複雑なコード命令データを生成することにより、SOTAオープンソースのCode LLMである「StarCoder」の機能を強化する。

わたしはChatGPTをコーディングで使うことが多いので、コーディング専用のLLMが出ると助かるかも。

2023/7/21 OpenAI、予め自分の設定をChatGPTに覚えておいてもらえる「カスタム指示」機能を追加

米OpenAIは7月20日（現地時間）、ChatGPTに「custom instructions」（カスタム指示）機能を導入したと発表した。同日からPlusプランのベータ版で利用可能になっている。今後数週間以内に全ユーザーに展開される見込みだ。カスタム指示を有効にすると、ChatGPTがレスポンスを生成する際に考慮すべきユーザーの希望や要件を記憶しておくことができる。

これは地味に便利だ…！

2023/7/22 「OpenAI APIの安定稼働版のようなイメージを持ってもらえればいい」 Azure OpenAI Serviceの特徴と、プレイグラウンドのデモ

2023年4月21日に開催された、日本マイクロソフトの蒲生氏による講演**『ChatGPTによって描かれる未来とAI開発の変遷』webセミナー**の書きおこしの3/8に該当します。

MicrosoftがOpenAIに出資したことは大ニュースでしたが、これから協業の強みを活かしてAzureがAWSにどう攻勢をかけていくのか気になるところです。

2023/7/27 ChatGPT の仕組みを理解する（前編）

2023/7/27 ChatGPT の仕組みを理解する（後編）

本記事の対象読者としては、以下のようになります

ChatGPT の基本原理から知りたいけど、自然言語処理（NLP）も強化学習も知らない。

但し、ディープラーニングはある程度詳細レベルで知っている。線形代数程度の数学も知っている

本記事では、ChatGPT の原理や仕組みの説明に終始しており、ChatGPT の使い方や OpenAI API の使用方法、ChatGPT の改良方法等の話は一切記載していません。

ChatGPTを使って見つつも基本原理からきちんと理解しておくことで、対話型 AI の課題や今後の進歩の方向性・実現可能性等を誰かがそう言ってたとかいう理由じゃなくて、自分なりに考察できるようになるメリットがあると思ってます。

しくみもちゃんと理解しておきたいですよね〜前後編で詳しく説明してあります。

しっかり読まねば。

2023/7/30 Qiitaで見る技術トレンド推移(2017 – 2023)

頻出ワードの抽出。ChatGPTはやっぱりバズってますね〜

末尾に新卒エンジニア向けの記事や「パイセン向け記事」などの紹介もあり参考になりそうです。

2023/2/14 30分で完全理解するTransformerの世界

GPTでも使われているTransformer。ちゃんと理解したい！

かなりのボリュームで、数式込みでしっかり解説してあります。

2023/4/5 順伝播型ネットワーク_E資格対策備忘録

この方は他にもE資格対策記事を書かれています。E資格を受ける時に参考にしたい。

テーマ別気になった記事

はじめに

特に気になった記事

テーマ別気になった記事

IT・AI記事

プログラミング

生成AI

マネジメント・自己啓発

技術

SNS

コメント