2023年7月分をまとめるのに、すごく大変だったので、毎日コツコツやるようにしようかと思います。できるだけ毎日更新できるようにします。
AIDBというサイト https://aiboom.net/
は論文の紹介もあってなかなかいいサイトの気がする…!
【2023/8/31追記】
毎日更新はできませんでしたが、8月の毎日分の記事をチェックしてまとめることができました!頑張ったな〜
一日あたり30分くらいの作業時間で、それほど苦ではありませんでした。自分のメモのため、と思って続けてきました。ご紹介した記事のすべてを読んでいるわけではないのですが、最新のニュースをチェックするのは楽しいですね。
主にRSSリーダーを使ってチェックしています。具体的なことはまた別の記事に書きたいと思います。
来月もコツコツ更新するので、見ていただけると嬉しいです。
気になった記事の中で、さらにピックアップしてみました。ここだけでもチェックしていただけると、大事なニュースは把握できると思います。
・Microsoftのエンタープライズ向けAzure ChatGPTの公開:Azure ChatGPT
・Stockmark社の日本語LLMの発表:Stockmark
・Stability AI Japanの日本語LLMの発表:Japanese StableLM Alpha
・OpenAIはChatGPTに多額のコストがかかっていて財政状況が良くない: ChatGPT In Trouble
・常温常圧超伝導体は実現ならず…:LK-99
・Stability AI Japanの日本語画像LLMの発表:Japanese InstructBLIP Alpha
・東大松尾研、日英対応のLLM公開: Weblab-10B
・OpenAI APIでGPT-3.5-turboがfine-tuningできるようになった:fine-tuning
・Metaが商用利用可能なコーディング支援AI「Code Llama」を発表: Code Llama
・東大松尾研、MetaのLlama2をベースとした商用利用可能な日本語LLMを発表:ELYZA-japanese-Llama-2-7b
・GoogleがAIサービス群発表:Duet AI, AlloyDB, SynthID, Vertex AI
- 2023年8月のとくに気になった記事
- 2023/8/31のピックアップ
- 2023/8/30のピックアップ
- 2023/8/29のピックアップ
- 2023/8/28のピックアップ
- 2023/8/27のピックアップ
- 2023/8/26のピックアップ
- 2023/8/25のピックアップ
- 2023/8/24のピックアップ
- 2023/8/23のピックアップ
- 2023/8/22のピックアップ
- 2023/8/21のピックアップ
- 2023/8/20のピックアップ
- 2023/8/19のピックアップ
- 2023/8/18のピックアップ
- 2023/8/17のピックアップ
- 2023/8/16のピックアップ
- 2023/8/15のピックアップ
- 2023/8/14のピックアップ
- 2023/8/13のピックアップ
- 2023/8/12のピックアップ
- 2023/8/11のピックアップ
- 2023/8/10のピックアップ
- 2023/8/9のピックアップ
- 2023/8/8のピックアップ
- 2023/8/7のピックアップ
- 2023/8/6のピックアップ
- 2023/8/5のピックアップ
- 2023/8/4のピックアップ
- 2023/8/3のピックアップ
- 2023/8/2のピックアップ
- 2023/8/1 のピックアップ
2023年8月のとくに気になった記事
2023/8/1 ロボットが「初めて見る環境」で「初めて聞く指示」に対しても行動をとれるようにする
2023/7/31 大規模言語モデルが音声をダイレクトに理解する能力を与える Metaとケンブリッジ大
2023/7/28 AIが生成したテキストが事実なのか確認する手法「FacTool」が登場
2023/8/2 大規模言語モデルに16,000以上のAPIを理解し適切に操作する能力を与える「ToolLLM」
2023/8/5 LLMを利用したRAG(Retrieval Augmented Generation)と著作権侵害
2023/8/4 Microsoft謹製エンタープライズ向けPrivate ChatGPT(Azure ChatGPT)が公開されたのでローカル環境で動かしてみた
2023/7/30 つくりながら学ぶ!AIアプリ開発入門 – LangChain & Streamlit による ChatGPT API 徹底活用
2023/8/7 生成AIによる著作権問題、日本弁理士会が論点整理
2023/8/7 Zoom中にマイクが拾ったキーボードの音から93%の精度で入力内容を推測可能、スマホならなんと95%との研究結果
2023/8/7 視覚から言語を理解して未来を予測する次世代のAI「Dynalang」
2023/8/8 最近の話題にも詳しい14億パラメータの日本語LLMの公開
2023/8/8 OpenAIが将来のAIモデルの改善に向けたウェブクローラー「GPTBot」を発表、同時にAIによる無断での学習を防ぐためのブロック方法も公開
2023/8/8 カーネギーメロン大など、大規模言語モデルの脆弱性を突く攻撃手法が存在することを指摘
2023/8/9 NVIDIA、生成AI向け“スーパーチップ”「GH200 Grace Hopper」を2024年に発売
2023/8/9 NVIDIA、生成AIモデルをPCやワークステーションで構築するための「AI Workbench」を近日リリース
2023/8/9 Stability AIがオープンソースのコーディング補助AI「StableCode」を発表
2023/8/10 Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開 他社上回る性能、商用利用も可能
2023/8/11 生成AI学習データ、事業者に開示指針 政府が骨子案
2023/8/12 ChatGPT In Trouble: OpenAI may go bankrupt by 2024, AI bot costs company $700,000 every day
2023/8/8 明らかになったGPT-4の秘密
2023/8/14 LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK
2023/8/14 IntelのCPUに発覚した新たな脆弱性、Downfallについて
2023/8/17 「常温常圧の超伝導体」として科学界に旋風を巻き起こしたLK-99が超伝導体ではないことはどのように明らかになったのか?
2023/8/17 日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました
2023/8/17 今年の7月は、1880年以降で最も暑い1カ月だった──米NASAが発表 「科学的に見ても正常ではない」
2023/8/18 東大松尾研、日英対応の大規模言語モデル公開 100億パラメータ、精度は「国内オープンソース最高水準」
2023/8/18 Metaがコーディング補助AI「Code Llama」の無料公開を計画中か
2023/8/18 GoogleのトップAI研究者2人、東京でAI企業Sakana.ai立ち上げ
2023/8/21 個人情報保護委「生成AI利用に注意」 事業者・行政機関向けにポイント解説
2023/8/22 国がスマホの「サイドローディング」を義務化したい理由 内閣府の担当者に直接聞いてみた
2023/8/22 Googleが「大規模言語モデルに視覚を与える仕組み」について解説、メルカリと協力して作成したデモも公開
2023/8/22 Python3.12からPEP692が導入され**kwargs: **TypedDict
でキーワードごとの詳細な型付けやDRY化ができるようになる
2023/8/22 今から始めて追いつけるAI学習入門セット、画像生成・音声変換・AIチャット・英単語をわかりやすいムービー形式で基礎から学べる「Udemy」講座まとめ
2023/8/23 Metaが日本語音声を入力するだけで「文字起こし」「翻訳」「吹き替え」を実行できるAI「SeamlessM4T」を公開、英語や中国に翻訳可能で無料で使えるデモも公開されたので使ってみた
2023/8/23 【速報】OpenAI APIでGPT-3.5-turboがfine-tuningできるようになりました!!
2023/8/23 Excelが「Python」に対応 シート上でコードを実行できるように グラフ作成、機械学習なども可能
2023/8/23 Google、LLMの「PaLM 2」と「Codey」で日本語をサポート
2023/8/25 Metaが商用利用可能なコーディング支援AI「Code Llama」をリリース、Llama 2と同じライセンスで無料公開へ
2023/8/25 “数学特化”の大規模言語モデル「WizardMath」 米Microsoftなどが開発 Llamaモデルを強化
2023/8/26 2023年版データ分析の100冊
2023/8/28 「AWS基礎100本ノック」日本公式が公開 クラウドの基礎や最新動向の調べ方、動画で解説
2023/8/28 医療団体、ITベンダーに「サイバー被害の一部を負担するべき」と提言 情報提供不足なら契約になくても責任求める
2023/8/28 エンジニア不足は「業界全体」の問題。LayerX松本CTOに聞く「自走できるエンジニア不足」から脱する方法
2023/8/28 2年間の開発者ブログ運営のノウハウや意識してること
2023/8/28 AIは意識を持っているのか/持つのか、AI研究者と意識研究者たちが共同研究した結果
2023/8/29 Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました
2023/8/29 GPT-4を2倍高速かつ無制限に使える「ChatGPT Enterprise」発表
2023/8/30 ムービーをアニメ風にしたり被写体を変えたり映っていない部分を補完したりできるAI「MagicEdit」が登場
2023/8/30 Googleが機械学習プラットフォーム「Vertex AI」のアップグレードを発表、生成AIを用いたアプリケーション構築がより手軽に
2023/8/30 GitHub Copilotの導入によってペパボの開発生産性はどう変化したか
2023/8/30 「仕事のメールを一瞬で生成する機能」や「プレゼン用の画像を生成する機能」を備えたAIサービス群「Duet AI」がGoogle Workspaceに搭載される
2023/8/30 GoogleがAI対応のPostgreSQL互換データベースサービス「AlloyDB AI」を発表
2023/8/30 Googleが「画像生成AIで生成した画像」に電子透かしを入れてフェイクの拡散を防止するツール「SynthID」を発表
2023/8/30 推論能力をさらに強める戦略『AoT』で、LLMが「直感」に似た能力を示すようになった
2023/8/31 犬・猫との共生を阻む社会課題の大きな原因、 動物アレルギーを克服する新しい一歩 ――光触媒で溶液と乾燥状態のイヌアレルゲンとネコアレルゲンの分解に成功――
2023/8/31 大規模言語モデル vs 小規模人間モデル(つまり人間)で「フィッシング詐欺メールバトル」を行った結果
2023/8/31のピックアップ
2023/8/31 “1那由他”通りの味を再現できる装置 ワインや梅干しの品種や産地も 生成AIで料理写真からも「きっとこんな味」
明治大学の宮下芳明研究室は8月31日、1那由他(10の60乗、1兆を5回かけた大きさ)通りの味を再現できる装置を開発したと発表した。基本となる5つの味覚(甘味、酸味、塩味、苦味、うま味)や辛味などの味を与える液体を組み合わせることで、さまざまな味を再現可能。また、大規模言語モデル(LLM)との連携機能も持つ。
2023/8/31 【アプリもインフラも1つの言語で書ける】Wingのチュートリアルをやってみる
Wingとはクラウド向けのプログラミング言語です。WingLangという独自の言語を使って、インフラとアプリを1つの言語で同時にコーディングできます。**公式サイト内**のイントロダクションの動画が分かりやすくて、おすすめです。(15分と短くて見やすいです)WingLangをコンパイルして、AWSやGCP、Azureなどに対応したTerraformやCDK、CFnを生成することができます。(2023/8時点では、AWSとTerraformに対応しています。)
2023/8/31 Dataiku、Databricks、LangChainでLLMアプリケーションを構築する
まず第一に、上記のようなLLMは、これらの非公開文書を使った学習はしてません。第二に、質問として入力するプロンプトおよび必要な関連情報は機密であり、SaaS LLMプロバイダーと共有することができません。さらに言うまでもなく、SaaS LLMのAPIトークンの料金は高額です。これらの課題を解決するために、このブログでは以下をお届けします:・ニッチ文書のコーパスからベクトルストアを作成し、このコーパスから適切なコンテキストを持つユーザープロンプトを賢く設計する方法を説明します。・小規模で低コストなオープンソースの基礎モデル、具体的にはDatabricksが30ドル以下でトレーニングした大規模言語モデル(LLM)であるDollyを使用して、ChatGPTのような人間的なやりとりを開発する例を提供します。・データ準備、プロンプトエンジニアリング、Q&Aチャットボットインターフェースのための包括的なパイプラインをDataiku内で構築する方法を示します。
2023/8/31 イヌとネコのアレルゲンの光触媒分解に成功、東大など初
東京大学、カルテック、犬山動物総合医療センターの共同研究チームは、光触媒技術により、溶液あるいは乾燥状態のイヌアレルゲン(人に犬アレルギーを引き起こす原因物質)とネコアレルゲン(同)を分解することに成功。光触媒によって動物アレルゲンが分解できることを初めて実証した。
2023/8/31 犬・猫との共生を阻む社会課題の大きな原因、 動物アレルギーを克服する新しい一歩 ――光触媒で溶液と乾燥状態のイヌアレルゲンとネコアレルゲンの分解に成功――
酸化チタン型光触媒技術により、溶液あるいは乾燥状態のイヌアレルゲンとネコアレルゲンを分解することに成功し、光触媒によって、動物アレルゲンが分解できることを世界で初めて証明しました。・酸化チタン型光触媒で処理したイヌアレルゲンとネコアレルゲンはアレルギー反応を引き起こすIgEとの反応性を失ったことから、酸化チタン型光触媒によってイヌアレルゲンとネコアレルゲンを分解することで、アレルギーを抑制できることを世界で初めて証明しました。
2023/8/31 LlamaIndexの性能向上のためのテクニックガイド
「LlamaIndex」によるRAG (検索拡張生成) のプロトタイプを作成するのは簡単ですが、それを本番用に性能と堅牢性を備えた大規模な知識コーパスに拡張するのは困難です。この記事では、「LlamaIndex」によるRAGの性能を向上させるためのさまざまなヒントを紹介します。最終的な目標は、検索 (retrieval) と生成 (generation) の性能を最適化し、より複雑なデータセットに対するより多くのクエリに幻覚なしに正確に答えることです。
2023/8/31 脳インターフェイス、利用者の同意どう得る? 難しい倫理的問題
脳コンピューター・インターフェイスは、全身麻痺などでコミュニケーション能力を失った人々への福音となる可能性がある。しかし、コミュニケーションを取る方法がまったくない人たちが、調査研究に参加することは倫理的な観点から難しい。
2023/8/31 大規模言語モデル vs 小規模人間モデル(つまり人間)で「フィッシング詐欺メールバトル」を行った結果
フィッシング詐欺、つまり不正なリンクをクリックさせるために送られる詐欺メール。この厄介な問題に対抗するため、ハーバード大学、MIT、KTH Royal Institute of Technologyなどの研究者チームが、大規模言語モデル(LLM)と人間のフィッシング能力を比較しました。その結果、驚くべきことに、小規模な人間モデル(つまり、人間自体)が勝利しました。さらに興味深いことに、この研究ではLLMと人間の組み合わせ(LLM+人間)が、人間単体と同等かそれ以上の効果を示したことも明らかになりました。これは、先端技術と人間の独自の能力が組み合わさることで、新たな可能性が広がることを示しています。
2023/8/30のピックアップ
2023/8/30 推論能力をさらに強める戦略『AoT』で、LLMが「直感」に似た能力を示すようになった
推論能力をさらに強化するための新しい戦略『AoT(Algorithm of Thoughts)』が登場しました。この手法によって、大規模言語モデル(LLM)が「直感」に似た能力を示すようになったとの実験結果が報告されています。この発表は、マイクロソフトの研究者をはじめとする専門家によって行われました。この研究は、推論タスクにおけるLLMの新たな可能性を広げるものであり、計算負荷の高さや効率の低さといった従来の課題を解決する方向性を示しています。
2023/8/30 ムービーをアニメ風にしたり被写体を変えたり映っていない部分を補完したりできるAI「MagicEdit」が登場
AI技術は急速に進歩しており、人間が作成したものと見分けが付かない文章や画像を生成できるAIなどが複数開発されています。新たに、TikTokの運営企業であるByteDanceの研究チームが文章で指示するだけでムービーを編集できるAI「MagicEdit」を開発しました。MagicEditではムービーの一部だけを置き換える編集も可能なほか、ムービーの映っていない部分を継ぎ足すことも可能です。
2023/8/30 ChatGPT時代に必要かも!? Pythonで実行するファイルパース(HTML編)
こんちには。データアナリティクス事業本部 インテグレーション部 機械学習チームの中村です。今回はPythonで動作するWebページのパーサーを色々と比較してみます。よく大規模言語モデルで使用されるLangChainやLlamaIndexなどの既存ライブラリについても確認していきます。なお、PDF編とPowerPoint編もございますのでそちらも良ければご覧ください。
2023/8/30 GitHub Copilotの導入によってペパボの開発生産性はどう変化したか
技術責任者の@kenchanです。GMOペパボ(以降ペパボ)では、2023年6月7日にGitHub Copilotの全社導入を決定し、現在は全エンジニアとデザイナーの希望者が利用しています。本記事では、ペパボにおけるGitHub Copilotの導入の効果と、導入に向けて検討した課題やその解決策や現在の利用状況を公開します。
2023/8/30 めんどくさがりやな新卒未経験が基本情報技術者を取得した勉強方法
はじめまして。この記事では、2023年四月に新卒でエンジニアになった果てしなくめんどくさがりやな自分が、新しくなった基本情報技術者試験をできるだけ効率よく取得しようと思い行った勉強方法を紹介したいと思います。
2023/8/30 全世界で70万台以上のデバイスに感染してさまざまなランサムウェアギャングに利用される凶悪ボットネット「Qakbot」をFBIが解体
2008年頃から存在が確認されている**トロイの木馬型マルウェアの「Qakbot(Qbot、QuackBot、Pinkslipbot)」は、感染したデバイスをボットネットワークに追加してリモートで制御可能にしてしまいます。2023年8月29日、10年以上にわたりオンラインで活動してきたQakbotのボットネットワークが、アメリカの連邦捜査局(FBI)と司法省**が主導する国際的な作戦で解体されたことが報告されました。
2023/8/30 バックオフィスSaaSは生成AIをどう取り入れるべきか マネーフォワードの現状と今後の課題
杉田圭さん(ビジネスカンパニー執行役員兼カンパニーCPO)や、子会社であるマネーフォワードi(東京都港区)の今井義人社長によれば、同社における生成AI活用には独自の考え方があり、最適な活用の形を模索している段階という。普及が急激に進むチャットAI。バックオフィスSaaSはこの波をどう乗りこなすべきか。同社グループによる機能開発の背景となる考え方や、現在直面している課題から、そのヒントを探る。
2023/8/30 PaLM2をVertex AIのコンソールから使ってコード化する方法も確認する
おはこんハロチャオ~!何者(なにもん)なんじゃ?じょんすみすです。みんな大好き生成AIですが、Google CloudのVertex AIからもPaLM2が使えます。 日本語でも利用できるようになっており、コンソール上からも簡単に試せるのでやってみましょう。
2023/8/30 Googleが機械学習プラットフォーム「Vertex AI」のアップグレードを発表、生成AIを用いたアプリケーション構築がより手軽に
Googleが現地時間2023年8月29日、AI開発・運用を簡単に行える機械学習プラットフォーム「Vertex AI」の対応モデル増加や、企業によるジェネレーティブAIを用いたアプリ構築を支援するための機能追加を発表しました。
2023/8/30 「仕事のメールを一瞬で生成する機能」や「プレゼン用の画像を生成する機能」を備えたAIサービス群「Duet AI」がGoogle Workspaceに搭載される
Googleは文章生成AIやコード生成AIなどからなるAIサービス群「Duet AI」を開発しています。新たに、「Googleドキュメントで文書のひな形を生成」「Googleスプレッドシートのデータを自動整理」といった機能を備えたGoogle Workspace向けDuet AIの一般提供開始が発表されました。
2023/8/30 Googleがコーディング補助やデータ解析が可能なAIサービス群「Duet AI」のプレビュー版をGoogle Cloudに導入
Googleが作業補助AIサービス群「Duet AI」のプレビュー版をGoogle Cloudに導入したことを発表しました。Duet AIにはコーディングやデータ解析などに役立つAIが含まれており、記事作成時点では無料でテスト可能です。
2023/8/30 生成AI「Duet AI for Google Workspace」の提供開始
米Googleのクラウド部門であるGoogle Cloudは8月29日(現地時間)、年次カンファレンス「Google Cloud 2023」を開催し、多数のAI関連の新機能を発表した。本稿はその中から5月発表の「Duet AI for Google Workspace」の一般提供開始について紹介する(個人向けはまだ)。企業ユーザーは無料トライアルを申し込める。
2023/8/30 GoogleがAI対応のPostgreSQL互換データベースサービス「AlloyDB AI」を発表
2023年8月30日から開催されているGoogle Cloudの技術発表イベント「Google Cloud Next ’23」において、GoogleのPostgresSQL互換データベースサービスである**AlloyDB**にAIを導入した機能セット「AlloyDB AI」が発表されました。
2023/8/30 Google、PostgreSQLにAI対応を組み込んだ「AlloyDB AI」発表 オンプレミスでも他社クラウドでも利用可能に
米Googleは、8月29日(日本時間の30日未明)から米サンフランシスコで開催中のイベント「Google Cloud Next ’23」で、同社が提供するPostgreSQL互換のデータベース「AlloyDB」にAI対応機能を組み込んだ「AlloyDB AI」を発表しました。
2023/8/30 Googleが「画像生成AIで生成した画像」に電子透かしを入れてフェイクの拡散を防止するツール「SynthID」を発表
GoogleのAI研究部門「Google Deepmind」が現地時間2023年8月29日に、AIで生成された画像にウォーターマーク(電子透かし)を入れ、AIが生成した画像であることを明示してフェイク画像の拡散を防止するツール「SynthID」のベータ版をリリースしたことを発表しました。記事作成時点では、Googleの機械学習プラットフォーム「Vertex AI」上の画像生成AI「Imagen」でのみ利用可能です。
2023/8/30 システムソフトウェアレイヤーの技術革新のタネは「自由な試行錯誤」 登大遊氏が語る、日本のICTの課題と取り組むべき“おもしろい”こと
天才プログラマー・登大遊氏をゲストに、リクルートのエンジニアと生対談を行う「20年前のインフラから20年後のインフラへ インフラエンジニアの今後とは?」。IPA産業サイバーセキュリティセンターの登氏、株式会社リクルートの小杉氏・鶴谷氏・竹迫氏が登壇。前半では、登氏が日本のICTの課題と、取り組むべきことについて話します。
2023/8/30 はてなブログをインデックスされやすくするために(寄稿:辻正浩)
ブログで書いた記事がGoogleなどの検索エンジンでインデックスされない(検索対象にならない)というお問い合わせをいただくことがあります。はてなブログでは今回、SEO専門家の 辻正浩さん に「ブログとインデックス」について寄稿いただきました。SEO専門家の観点で、この問題とその解決方法、はてなブログの状況について解説してもらいました。
2023/8/30 【論文読み】音楽(楽譜表現)とテキストのマルチモーダル学習モデルCLaMPについて
今回は,音楽のもう一つの側面である楽譜の表現の基盤モデルを紹介します.それが,今年Microsoft research AsiaがリリースしたCLaMPです.これを解説したいと思います.この記事は以前個人用にサーベイしたもののリメイクで,もしかしたら雑な部分があるかもしれません.間違い等ございましたらご指摘お願いします.
2023/8/30 「仕事のほぼ全部をChatGPTとやっている」 深津貴之さんの活用術 “身代わり”になる新ツールも開発中
ChatGPTをはじめとする生成AIは、さまざまな業務や日常生活のシーンを変革する可能性があるとして、活用の道が模索されている。そんな中、ChatGPT活用の第一人者・深津さんと、AI研究の第一人者・松尾豊さん(東京大学 教授)が約1時間にわたり対談した。2人はChatGPTをどのように活用しているのか。両者が登壇したITmedia主催のオンラインイベント「Digital Business Days -SaaS EXPO- 2023 Summer」(8月22日~9月10日)の講演の一部をお届けする。
2023/8/30 「助けてくれ」とはっきり言う人しか、助けないほうがいい。
困っている人を見て見ぬふりをするのは、あまり褒められたことではありませんが、「何も考えずに助ける」行為も、よくありません。小学校では「困っているお友達は助けてあげましょう」と指導されるかもしれませんが、大人の世界ではもう少し複雑で、思慮が必要な行為なのです。
2023/8/29 スマホいらず、指かざせば決済完了 東武ストアで 東武鉄道と日立がID基盤、改札導入も視野に
東武鉄道と日立製作所は8月29日、生体認証を活用したデジタルアイデンティティの共通プラットフォームを2023年度中に立ち上げると発表した。買い物、宿泊、エンターテインメントなどあらゆる場面で、本人確認から支払い、ポイント付与まで、生体認証のみで利用できるようになる。
2023/8/29 ハダカデバネズミが持つ長寿遺伝子を移植したマウスで実際に寿命を延ばすことができることが判明、人間の長寿と健康に役立つ可能性が示唆される
地中で生活する**ハダカデバネズミ**が持つ、長寿に関わると考えられている遺伝子をマウスに移植した結果、マウスの健康状態が改善し、寿命が延びたことがロチェスター大学の研究チームによって報告されています。
2023/8/29のピックアップ
2023/8/29 東大発AIベンチャー、最大級の日本語LLM公開 metaの「Llama 2」を日本語化
東京大学松尾研究室発のAIスタートアップ、ELYZAは8月29日、日本語LLM(大規模言語モデル)「ELYZA-japanese-Llama-2-7b」を公開した。米Meta PlatformsのLLM「Llama 2」に日本語で追加事前学習を行い“日本語化”した。
2023/8/29 Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました
・ELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開
・性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準
・Chat形式のデモや評価用データセットも合わせて公開 既に社内では、130億、700億パラメータのモデルの開発も進行中
2023/8/29 AMIのバックアップを使ったリストアを行う
EC2ではAMIの形でバックアップを作成することで新しくインスタンスを簡単に起動することが可能です。 今回はAMIからのバックアップのリストア方法を解説します
2023/8/29 5分でできるHydraによるパラメーター管理
HydraはMeta(旧Facebook)が開発したPython用の設定管理ライブラリです。このライブラリを使用すると、プログラムの設定を効率的に管理できます。特に機械学習のような、多数のパラメータを持つプロジェクトで役立ちます。
2023/8/29 ジュピターノートブックの内容をそのままqiitaに投稿する
ノートブックの内容やコードをqiitaの記事に引用する場面があり、いっそ最初から投稿を見据えた内容でノートブックを作っておいて、丸ごと貼り付ければいいのではと思いそうすることにしました。VSCodeからですとmdファイルとしてエクスポートする項目が見当たらなかったので以下のライブラリを使用しました。
2023/8/29 NTT、光ケーブル1本で通信と”電気”も供給 世界初14km先に1W給電
NTTは、北見工業大学と共同で、光ファイバーケーブル1本で14km先に1Wの電力を供給しながら、10Gbpsの高速通信も実現する世界初の実証に成功した。光ファイバーの通信速度に影響を与えず電力を供給できる。
2023/8/29 【レポート】生成系AIの創造性を整理し、よりよい共創ついて考える #CEDEC2023 #classmethod_game
データアナリティクス事業本部 機械学習チームの鈴木です。CEDEC2023に参加してきました。 聴講したセッション『オルタナティブな生成AIと創る未来 — AIと人の共創による創造性の拡張』についてレポートします。
2023/8/29 noteが画像生成AIに対応へ Adobeと連携 年内にサムネの自動作成が可能に
noteは8月29日、note記事のサムネイル画像を簡単に生成できる機能を追加すると発表した。米Adobeのデザインツール「Adobe Express」との連携に対応。年内には、PC版でテンプレートを使った画像作成に加え、同ツールの生成AI機能「Firefly」も使えるようになる。
2023/8/29 ペットボトルのラベル剥がしを不要に キリン、リサイクルできる直接印刷技術を開発
キリンホールディングスは8月29日、リサイクルに対応したペットボトルの直接印刷技術を発表した。実用化されると消費者はゴミ分別でフィルム状のシュリンクラベルを剥がす手間がなくなる。
2023/8/29 Mojoプログラミング言語の紹介
Mojoは、PythonのシンプルさとRustのスピードとメモリの安全性を組み合わせた、新しく発表されたプログラミング言語である。開発の初期段階にあり、その機能を探求するためのオンラインプレイグラウンドをユーザーに提供している。Mojoはデータサイエンスと機械学習における卓越性を目指しており、Pythonに代わる高速な言語を提供する。オープンソース化も徐々に計画されている。
2023/8/29 GPT-4を2倍高速かつ無制限に使える「ChatGPT Enterprise」発表
OpenAIがChatGPTの企業向け有料プラン「ChatGPT Enterprise」を2023年8月28日(月)に発表しました。ChatGPT EnterpriseではGPT-4を無制限に利用可能で、動作速度は最大2倍になるとのこと。さらに、データ送受信時の暗号化機能も提供されるなど、セキュリティ面も重視されています。
2023/8/29 車体や建物への充電を可能にする3Dカーボン材料、東北大ら開発
東北大学とジョンズ・ホプキンス大学の研究グループは、自動車の車体や建物の構造や外装への充電を可能にする3次元カーボン材料を開発した。自動車の車体や飛行機の翼など、荷重や自重を支えて形状を保つ構造部をエネルギー貯蔵に利用する「構造的エネルギー貯蔵」の実現に向けた一歩となる。
2023/8/29 「四季報AI」β版で分かった、AIだからできること、そして想定外のニーズ
ChatGPTをはじめとする生成AIの動きも、実にさまざまな進化が続き、すでに業務改善DXのような形で、ビジネスの現場でも活用されています。そんな中、これまでとは少し変わった形でリリースされたのが、東洋経済新報社の「四季報AI」です。
2023/8/29 GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに
今回紹介する研究は、大規模言語モデル(LLM)であるGPT-4が、多肢選択問題(MCQ)において選択肢の順序に敏感であるという事実を明らかにしています。この研究は、リクルートのAI研究所であるMegagon Labsのグループによって発表されました。研究者たちは、GPT-4とInstructGPTの2種類のモデルを用いて、5つの異なるMCQベンチマークで実験を行いました。その結果、選択肢の順序を単純に入れ替えるだけで、モデルの性能に13%から75%もの大きな変動が生じることが確認されました。この記事では、この研究の詳細とその意義、そして今後どのような対策が考えられるのかについて、深く掘り下げていきます。
2023/8/28のピックアップ
2023/8/28 「1万年前に砂漠で生まれたネコがなぜマグロを好むのか?」の謎が科学的に明らかに
ネコと言えば魚好きで知られており、特にマグロを使ったキャットフードやネコ用おやつは大量にあります。ネコを飼っている人でも「愛猫は何となくマグロが好きらしい」と感じている人も多いと思いますが、「なぜネコはマグロが好きなのか?」を研究者が科学的に解き明かしました。
2023/8/23 日本語・英語・中国語でたった3秒の音声から人の声を再現可能なMicrosoftの「VALL-E-X」を独自にトレーニングしたゼロショットモデルが公開中
Microsoftが公開する「VALL-E」は、たった3秒間の音声サンプルから人の声を再現できる音声合成AIです。このVALL-Eで英語以外にも対応した「VALL-E X」を独自にトレーニングしたゼロショットモデルが、GitHubで公開されています。
2023/8/28 【非エンジニアによるChatGPT活用】ChatGPT×Googleスプレッドシート連携する方法について
アノテーションのMasashiです。現在ChatGPTやOpenAIの出現により様々なことができると話題になっており、弊社のブログでも様々なブログ記事の執筆があります。 ChatGPTの記事一覧 技術的な内容が多い中で、私のような非エンジニアにはどのようなことができるのかを日々考えており、今回はChatGPT×Googleスプレッドシートを連携し活用する方法を共有します。(シリーズ化できたらいいな~と勝手に考えております)
2023/8/28 Metaのコーディング支援AI「Code Llama」に調整を加えることでOpenAIのGPT-4の性能を上回る可能性が報告される
FacebookやInstagramなどを運営するMetaが2023年8月にリリースした「Code Llama」は、テキスト入力を元にプログラムのコードを生成してくれるコーディング支援AIです。そんなCode Llamaを微調整した「CodeLlama-34B」と「CodeLlama-34B-Python」をOpenAIのテストデータセット「HumanEval」でテストした結果、OpenAIの大規模言語モデル「GPT-4」の結果を上回ったことが報告されています。
2023/8/28 「AWS基礎100本ノック」日本公式が公開 クラウドの基礎や最新動向の調べ方、動画で解説
AWSジャパンは8月28日までに、日本オリジナルの学習コンテンツ「AWS基礎100本ノック」を、オンライン学習サービス「Skill Builder」で公開した。非IT領域の担当者や学生向けの映像コンテンツで、Amazonのアカウントがあれば無料で視聴できる。
2023/8/28 matplotlib 折れ線グラフのマーカー色を変えながらプロットする
時系列データを python で折れ線グラフで描画する際、**「グラフの値とは別な指標でマーカ色を変更したい」**というニーズに対するものです。
2023/8/28 マジックナンバーとは?分析の始め方や役立つツールについて解説!#mixpanel
グロースハック大好きっ子の國崎です。今回はグロースハックに繋がる分析「マジックナンバー」について解説します。
2023/8/28 医療団体、ITベンダーに「サイバー被害の一部を負担するべき」と提言 情報提供不足なら契約になくても責任求める
医療政策の企画立案などを目的とする日本医師会総合政策研究機構(日医総研)が8月24日に公開した文書が、SNS上で物議を醸している。医療機関とシステムベンダーの契約と責任分担に関するもので、「信義誠実の原則」を理由に「ベンダーのリスク説明が不足している場合、契約に記述がなくても、医療機関側から一定の責任を問える可能性がある」との内容が記されている。
2023/8/28 makeを使ってNotionのdatabase itemsからLLMをチューニングするためのデータセット(JSONファイル)を作ってみたい
内部の情報をもとにしたAIチャットぼっとを試作する際に利用するためのデータセットのサンプルとして、Notionのデータベースのアイテムを利用してみます。
2023/8/28 エンジニア不足は「業界全体」の問題。LayerX松本CTOに聞く「自走できるエンジニア不足」から脱する方法
多くの企業がエンジニア採用に悩む昨今、自走できるエンジニアの人材不足は業界全体の課題となっています。「いないなら育てればいい」と、2022年に若手エンジニアのコミュニティ形成のために「エンジニア育成ワーキンググループ」を立ち上げたLayerX社CTOの松本勇気さん。エンジニア育成に精力的に取り組む彼は、***「エンジニアが足りないのに育成が進んでいない。これには構造的な原因がある」***と語ります。エンジニア不足を引き起こす構造的な問題とは何なのか?どんなエンジニアを育てるべきか?リソースが足りない中でも一生懸命育成したエンジニアが他社に転職してしまうリスクをどう捉えているのか?取材しました。
2023/8/28 2年間の開発者ブログ運営のノウハウや意識してること
みなさんこんにちは、イノベーションセンターの @Mahito です。普段は社内のエンジニアが働きやすくなることを目標に、コーポレートエンジニアとしての活動やエンジニア向けイベントの企画・運営をしています。今回は、本 NTT Communications Engineers’ Blog を2年間運営してきたノウハウについて共有できればと思います。先日 はてなブログ DevBlog Meetup #1 に登壇させていただく機会があり、ブログ運営に関していくつかお話しさせていただいたのですが、イベント当日に言えなかったことや言ったことの補足などをできればと思います。
2023/8/28 自分のイラストや写真を画像生成AIが学習するのを妨害する電子透かしを入れるツール「Mist」
Stable DiffusionやMidjourneyなどの画像生成AIはデータセットの画像から学習していますが、このデータセットに含まれる画像の著作権については議論があり、「自分のイラストや写真をAIに学習されたくない」という人も多くいます。上海交通大学の研究チームが発表した「Mist」は画像に見えない透かしを入れることで、AIによって画像を認識できなくさせ、学習を防ぐ処理ツールです。
2023/8/27のピックアップ
2023/8/27 デスクトップアイコンから一発で特定のディレクトリ&conda環境のプロンプトを開く
パイソンで作業をするとき、作業ディレクトリに移動してcondaなどの環境を開くのは面倒です。そこで、デスクトップアイコンをダブルクリックしたら特定のconda環境とディレクトリが一発で開くようなショートカットを仕込んでみます。
2023/8/27 【備忘録】pip installが使えないときにローカルでPythonライブラリをインストールする
pip install
はインターネット(PyPI)から自動でライブラリを取ってきてインストールしてくれるコマンドです。インターネットからファイルを持ってこようとしたときに、コマンドの実行がプロキシに阻まれてしまったようです。会社のプロキシサーバーからインターネットに接続している環境では稀によくあるケースのようで、プロキシをset HTTPS_PROXY = <http://ProxyServerIP>:Port
などで設定できれば直で解決できるようですが、今回はプロキシを通すアプローチはできませんでした。そこで私はPyPIからライブラリのインストール用ファイルをダウンロードしにいって、ローカルでインストールする手法を取りました(本題)。
2023/8/26のピックアップ
2023/8/26 2023年版データ分析の100冊
【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本がご好評いただいてましたが古くなりごちゃごちゃしているので新たに作り直しました
2023/8/26 2023年を特に暑くしている4つの気象条件まとめ、2024年以降はどうなるのか?
2023年7月4日にはそれまでの観測史上最高気温が観測され、その後も暑い日が続いて「2023年7月はこれまでで最も暑い月」となるなど、2023年の夏はとにかく記録破りの暑さです。気候変動の深刻化により今後も激しい気象が続くと予想されますが、特に2023年は4つの現象が重なったことで例年にない酷暑が世界を襲っていると、セントルイス・ワシントン大学文理科学科のマイケル・ワイセッション氏が指摘しています。
2023/8/26 機械学習のデータセットはどう失われるか
機械学習では、データセットが重要であることを先に述べた。機械学習のデータセットの重要性しかし、そのデータセットとは実は容易に失われてしまいやすいことを述べておきたい。
2023/8/26 乗客を飛行機から降ろす時間を半分に短縮できるという「Fill&Flush」とは?
飛行機から乗客を降ろす時は、前から順番に降ろすのが一般的です。しかし、降りる乗客は荷物を棚から下ろす作業を行うので、乗客の流れが悪くなり、時間がかかってしまいます。この問題を解決するための方法として、ソフトウェア・エンジニアのジョゼフ・コムズ氏が「Fill&Flush(埋めて流す)」という方法を提唱し、そのシミュレーションを公開しています。
2023/8/26 Python & simple-salesforce を使って Salesforce のオブジェクト項目一覧・各属性情報を抽出する
生成 AI を活用して Salesforce をごにょごにょしようとした時に、オブジェクトの項目一覧・各属性情報をうまく使う必要が出てきました。抽出のやり方はいくつかあるのですが、出力結果をテキスト整形したかったこともあり、この目的のための使い用としてはあまり見かけない Python & simple-salesforce を使った例の記録です。
2023/8/25 初のKaggleで銅メダル、初のSIGNATEで金メダルを獲ったおはなし
どうも初心者です。機械学習コンペへの人生初参加から二連続でメダルを獲得できたので今まで自分なりにしてきたことを軽く書こうと思います。
2023/8/25 【データ分析】5か月でゴールドをとれた私文の僕が「やってよかったこと」
この記事は「データサイエンスって?」から「データ分析初めてみたけどよくわからん!ソロきつい!」程度までの人向けの記事です。大分抽象度の高い記事しなっていると思うのでばりばりコンペに参加している人にとっては退屈以外の何物でもないのでご了承ください。また、技術的な側面は先人たちがqiitaに山ほど残してくれていると思うのでここでは環境的、気持ち的なことを主に述べようと思います。
2023/8/25のピックアップ
2023/8/25 Meta、コード生成LLM「Code Llama」
Metaは、コードと自然言語プロンプトの両方からコードとコードに関する自然言語を生成できるコーディングツール「Code Llama」を発表した。研究及び商用利用は無料。テキストプロンプトを利用してコードを生成できる大規模言語モデル(LLM)。Llama 2をベースとしてコードに特化したバージョンで、コード固有のデータセットによりLlama 2をさらにトレーニング。同じデータセットからより多くのデータを長時間サンプリングすることによって作成された。
2023/8/25 Metaが商用利用可能なコーディング支援AI「Code Llama」をリリース、Llama 2と同じライセンスで無料公開へ
FacebookやInstagramを運営するMetaが、テキスト入力を元にプログラムのコードを生成するAI「Code Llama」をリリースしたと発表しました。モデルはLlama 2と同じ「Llama 2 Community License」で公開されており、月間アクティブユーザー数が7億人以下の場合は無償で商用利用することが可能です。
2023/8/25 NEC、LLMと画像分析で災害状況を迅速に把握 番地レベルで位置特定
NECは、大規模言語モデル(LLM)と画像分析により被災状況を把握する技術を開発した。災害発生時に集まる膨大な被災現場の画像から、即時かつ的確に被災状況・場所を把握することが可能になる。
2023/8/25 [新サービス] AWS Dedicated Local Zones が発表されました
しばたです。昨日AWSより新たにAWS Dedicated Local Zonesの提供が発表されました。AWS Dedicated Local Zonesをひとことで言うと「顧客専用のLocal Zoneを提供するサービス」となります。主に政府機関や公共機関などのセンシティブなデータを取り扱いセキュリティやコンプライアンスに関して厳しい要件が定められているケースにおいて、顧客専用のLocal Zoneを提供することで問題を解決するためのサービスです。
2023/8/25 GitHub Copilotをエンジニア全員に導入して開発生産性を継続的に上げていく
こんにちは。Magic Momentの髙橋です。ここのところ世間では生成系AIが注目されていますが、エンジニアが一番注目しているのはその中でもコードを自動生成してくれるAIではないでしょうか?その中でもよく名前が上がるのが、GitHub Copilotだと思います。Magic Momentではエンジニアの生産性をあげるべく様々な施策を実行してきましたが、今回GitHub Copilotを会社として公式に導入していくことになりました!導入してまだ1ヶ月程度ではありますが、どのように運用しているのか?開発にどのように役立っているのか?をご紹介したいと思います。
2023/8/25 「企業でNotionを導入する際に知っておきたい機能やポイント」というビデオセッションを公開しました #devio2023
**ネクストモード**の南です。DevelopersIO 2023のセッションの一つとして「企業でNotionを導入する際に知っておきたい機能やポイント」というビデオセッションをYoutubeに公開しました。
2023/8/25 脳信号だけでアバターを操作。表情や音声を復元、対話することに成功 米研究者らが発表【研究紹介】
カリフォルニア大学サンフランシスコ校とバークレー校に所属する研究者らが発表した論文「A high-performance neuroprosthesis for speech decoding and avatar control」は、脳の信号だけでデジタルアバターを操作できるシステムを提案した研究報告である。実験では、脳幹の脳卒中で重度の麻痺を持つ女性が、このブレイン・コンピュータ・インタフェース(BCI)を使ってデジタルアバターを通じて会話することに成功した。
2023/8/25 “数学特化”の大規模言語モデル「WizardMath」 米Microsoftなどが開発 Llamaモデルを強化
米Microsoftと中国科学院に所属する研究者らが発表した論文「WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct」は、数学的推理能力を強化するモデルを提案した研究報告である。このモデルは、オープンソースの事前学習済み大規模言語モデル(LLM)である「Llama-2」に対して適用することで実現する。
2023/8/25 複数人の会話から特定の1人だけを音声識別する手法 米NVIDIA「CONF-TSASR」開発
米NVIDIAの研究者らが発表した論文「Conformer-based Target-Speaker Automatic Speech Recognition for Single-Channel Audio」は、複数人が同時に話す環境で特定の話者だけの音声を分離して識別する手法を提案した研究報告である。
2023/8/25 JavaScriptランタイム「Bun」がバージョン1.0に到達へ、9月7日にローンチイベント開催
サーバサイドで実行可能なJavaScriptランタイム「Bun」が9月7日(日本時間9月8日)にバージョン1.0に到達することが分かりました。公式サイトで「Bun 1.0」のローンチイベントへの申し込みが始まっています。
2023/8/25 「チャットハルヒ」既存のキャラクターの性格をLLMに模倣させることに特化したフレームワーク
香港企業SenseTimeなどの研究者たちが挑んだのは、アニメや映画のキャラクターにおける性格や話し方をLLMに模倣させるという革新的なプロジェクトです。彼らの研究は、キャラクターと現実世界との橋渡しを目指し、新しいエンターテイメント体験を提供する可能性を秘めています。本記事では、この興味深い研究に焦点を当て、研究者たちのアイデア、方法論、実験結果を詳細に探求します。
2023/8/24のピックアップ
2023/8/24 二酸化炭素をプロパン燃料へ効率的に変換する革新的な電解装置が考案される、温室効果ガスの削減と再生可能な化学品製造に大きな可能性
温室効果ガスの中で最も排出量が多い二酸化炭素を、大規模かつ経済的に実行可能な方法で燃料として用いられる**プロパンに変換する電解装置を、アメリカ・イリノイ工科大学**の研究チームが発表しました。
2023/8/24 Pythonの『リストコピーの罠』と『変更できない』オブジェクトという概念の明示に向けて
pythonの
*
による『リストコピーの罠』はよく知られている。公式サイトから例を引用する。
2023/8/24 よくある『エレコム・ロジテック・ロジクールの関係性の勘違い』公式による経緯説明あり「完全にごっちゃにしてた」
2023/8/24 ChatGPTのプロンプトを自動改善するPrompt Perfectプラグインを使ってみた
カメラ好き機械学習エンジニアの@yktm31です。ChatGPTは便利ですが、プロンプトの内容でいかに質問・指示するかで、その精度はだいぶ変わってきます。うまく質問・指示するのは、工夫が必要だったりしますが、そこで役立つのが、「Prompt Perfect」というプラグインです。
2023/8/24 このままでは暑すぎて植物が光合成できなくなり世界の熱帯雨林が消滅する
記録的な猛暑により連日**熱中症警戒アラート**が発令されるなど、地球の暑さが人間の限界に達しつつあることが肌で感じられるようになりました。さらに、気候変動により植物の葉が光合成できないほど熱くなり、最終的に世界の熱帯林が崩壊する危険性があるとの論文が、科学誌・Natureに掲載に掲載されました。
2023/8/24 東京都、全局にChatGPT導入 ガイドライン公開、ルールからプロンプトのコツまで
東京都は8月23日、文章生成AI「ChatGPT」を、全局の職員5万人が利用できる体制を整えたと発表した。Microsoftの「Azure OpenAI Service」を導入した。職員向けの「文章生成AI利活用ガイドライン」も一般公開。利用のルールやプロンプトのコツ、今後の展望などを、有識者に意見を求めながらまとめた。
2023/8/24 [アップデート] コスト配分タグで最終更新日と最終使用月が確認出来るようになったので、メタデータを参考にコスト配分タグの棚卸しが出来るようになりました
いわさです。AWS ではユーザーが独自に定義したタグをリソースに割り当てることで、タグごとの使用量の集計を行うことが出来ます。Billing のコスト配分タグメニューでコスト配分タグの一覧を確認することが出来るのですが、本日のアップデートでこちらの情報にタグごとの最終更新日と最終使用月が追加されました。
2023/8/23のピックアップ
2023/8/23 もっと仲間を増やしたい!SmartHRの女性エンジニアが抱える切実な思いとは
SmartHRでプロダクト開発に携わっているエンジニアは104人(※2023年8月1日時点)。そのうち女性は10人しかいません。スクラムチームは15以上あるため、女性エンジニアはチームに1人いるかいないかという状況。そこで今回、チームの垣根を越えて女性同士で語り合ってみよう!ということで、女性エンジニア座談会を開催しました。日頃の悩み、開発組織の課題…赤裸々にトークするなかでわかったのは「みんな同じことを思っていたんだ…!」ということ。本記事ではそのトーク内容の一部を公開します。
2023/8/23 OpenAIが「GPT-3.5 Turbo」のファインチューニング機能をリリース、用途に合わせた独自のカスタマイズが可能に
対話型AIのChatGPTを開発した**OpenAIが、2023年3月にリリースしたGPTモデルファミリー「GPT-3.5 Turbo」のファインチューニング(微調整)**機能を発表しました。GPT-3.5 Turboをファインチューニングすることにより、「出力する言語を固定する」「応答の言葉遣いをブランドや企業のイメージに沿ったものにする」など、ユーザーの用途に合わせたカスタマイズが可能になるとのことです。
2023/8/23 【速報】OpenAI APIでGPT-3.5-turboがfine-tuningできるようになりました!!
2023/8/23 Googleがアプリ起動を30%高速化させる「Androidランタイム」のアップデートを発表、Android 12以降なら古いスマホも高速化
Googleが2023年8月21日に、**Android Runtime(ART)**のアップデートによりアプリの起動時間や実行速度を大きく向上させられるようにすると発表しました。ARTがOSとは独立して更新できるようになったことで、古いAndroidがインストールされているスマートフォンでもアプリのパフォーマンスが改善することが期待できます。
2023/8/23 SORACOM UG Tokyo #16 で「5分で分かる AWS IoT TwinMaker とデジタルツイン」というテーマで登壇しました
こんにちは、CX事業本部 Delivery部の若槻です。8/22にクラスメソッド日比谷オフィスで開催された SORACOM UG Tokyo #16 で「5分で分かる AWS IoT TwinMaker とデジタルツイン」というテーマで登壇させて頂きました。
2023/8/23 ExcelでPythonを使えるようにするとMicrosoftが発表
Microsoftが表計算ソフト「Excel」上でPythonを動作させることを可能にすると発表しました。**Microsoft 365 Insider Program**を通して使用できるベータ版のExcelで既にPythonが利用可能になっています。
2023/8/23 Excelが「Python」に対応 シート上でコードを実行できるように グラフ作成、機械学習なども可能
米Microsoftは8月22日、Excelにプログラミング言語「Python」を搭載すると発表した。セルに「PY関数(=PY)」を入力するとPythonのコードを記述できるようになる。Pythonのライブラリとシート上のデータを参照して高度なグラフ作成や機械学習などができるという。
2023/8/23 Metaが日本語音声を入力するだけで「文字起こし」「翻訳」「吹き替え」を実行できるAI「SeamlessM4T」を公開、英語や中国に翻訳可能で無料で使えるデモも公開されたので使ってみた
Metaが音声を入力するだけで「文字起こし」「別言語への翻訳」「別言語への吹き替え」を実行できるAI「SeamlessM4T」を2023年8月22日(火)に公開しました。SeamlessM4Tは日本語音声の入力にも対応しており、日本語・英語・中国語・フランス語などを含む35言語への出力をサポートしているとのこと。誰でも使えるデモも公開されていたので、実際にデモを使ってどれだけの精度で文字起こしや吹き替えを実行できるのか試してみました。
2023/8/23 Google、LLMの「PaLM 2」と「Codey」で日本語をサポート
米Googleは8月22日、東京で開催したイベント「Generative AI Summit」の基調講演で、大規模言語モデル(LLM)の「PaLM 2」を日本語で利用できるようにしたと発表した。
2023/8/23 画像生成AI「Stable Diffusion」に「悪い例を集めたLoRA」を組み合わせて高品質な画像を生成する手法が登場、簡単に試せるデモも公開されたので試してみた
2023年7月に公開された「Stable Diffusion XL 1.0(SDXL 1.0)」は既存のStability AI製モデルと比べて高品質な画像を生成できるだけでなく、LoRAによる生成画像の調整にも対応しています。データサイエンティストの**マックス・ウルフ**氏は「悪い例」を集めて作成したLoRAを用いてSDXL 1.0による生成画像の品質をさらに向上させる手法を考案し、LoRAファイルおよび誰でも試せるデモを公開しています。
2023/8/23 ジャンパー線を使わずにプロトタイピングできるブレッドボード「Jumperless」
ジャンパーワイヤー不要のArduino Nano搭載ブレッドボード「Jumperless」をArduino公式ブログが紹介した。
Jumperlessの特徴は、アナログクロスポイントスイッチをまとめて1個の大きなスイッチに接続していることだ。ソフトウェアコマンド経由で、基板上の任意のポイント間や基板上部のArduino Nanoヘッダーとの間で実際にハードウェア接続を実行できるため、ジャンパーワイヤーを使用する必要がない。
2023/8/23 ヴイエムウェアとNVIDIA、生成AIプラットフォームを発表
VMwareとNVIDIAは米国時間8月22日、VMwareがネバダ州ラスベガスで開催している年次カンファレンス「VMware Explore 2023」で、生成AI分野の新たな協業を発表した。両社の技術を組み合わせた企業向け生成AIプラットフォーム「VMware Private AI Foundation with NVIDIA」を2024年初頭にリリースする。
2023/8/22 SlackとChatGPTの連携でサーバー管理が楽になるのでは? ノーコードで作る中で感じた可能性
「ChatGPT Meetup」は、プロンプティングからOpenAI API、さらには周辺のライブラリやHubのエコシステムまで広く活用の助けになる知見を共有し、みんなで手を動かして楽しむためのコミュニティです。1回目に登壇したのは、株式会社ABEJAの村主壮悟氏。サーバー管理にChatGPTを活用した時の取り組みについて発表しました。
2023/8/22 「GPT-4の真骨頂」Function callingをプログラミングなしで使い倒す方法
本記事は、Function callingをノーコードでサクッと動かし、その凄さを体感してもらうための記事です。※本記事は、会話型AI構築プラットフォームmiiboを開発する、株式会社miiboの提供です。
2023/8/22のピックアップ
2023/8/22 ムービーとテキストからフレーム間の一貫性を維持して実用性の高いムービーを生成するAI「StableVideo」
2022年8月にStability AIの「Stable Diffusion」が登場して以来、画像生成AIは急激な進歩を遂げ、画像だけではなくムービーも生成できるようになりました。しかし、生成AIによって作られるムービーに描かれるオブジェクトや背景は形を激しく変えたり色が変わったりするため、実用性には乏しいといえます。浙江大学とMicrosoftの研究チームが発表した「StableVideo」はテキスト駆動拡散モデルに時間の概念を導入することで、安定していて実用性が高いムービーを生成することが可能となっています。
2023/8/22 さくらインターネット、GPUクラウド強化を前倒し 生成AI意識
さくらインターネットは8月21日、6月に発表したGPUクラウドサービスへの投資計画を前倒しで進めると発表した。同社は今後3年間で130億円を投じる計画を掲げており、2023年内に32億円の投資を発表していたが、24年以降の具体的な内訳は未定で、期末に向けて詳細を定める予定だった。しかし、当初の見込みを上回る引き合いがあったとしてから決定を前倒し。24年に78億5000万円を投じることを決めた。資金はいずれもGPUサーバやネットワーク機器、ストレージ機器の調達に充てる。これにより、さくらインターネットは24年4月までに機材を調達できる見込み。
2023/8/22 日本の研究で幼児期の「スクリーンタイム」の長さと発達の遅れとの間には関連性があることが判明
「スクリーンタイム」とは、テレビの視聴やビデオゲームのために画面を見たり、スマートフォンやタブレットなどの電子機器を使ったりして過ごす時間のことです。1歳の時のスクリーンタイムの長さと、2歳および4歳の時点でのコミュニケーションや問題解決に関する発達の遅れとの間に関連があることがわかったと、東北大学が発表しました。
2023/8/22 松尾研、公開したLLMの「オープンソース」記述を削除 X(Twitter)で指摘相次ぐ
東京大学院工学系研究科・松尾研究室(主宰:松尾豊教授)は8月22日、「オープンソース」として18日に公開した大規模言語モデル(LLM)「Weblab-10B」について、「商用利用不可のため定義に当てはまらない」としてオープンソースの記述を削除した。
2023/8/22 自分のエディタで記事投稿ができる、Qiita CLIの使い方
Qiita CLIとは、手元の環境で記事の執筆・プレビュー・投稿ができるツールです。Qiita CLIを使うことで、普段ご自身で使っているエディタなどを使って記事の執筆・投稿がしやすくなります。
2023/8/22 PyAutoGUIを仮想環境(Hyper-V)で活用:効率的なプログラム実行と並行作業の実現
本稿では、PyAutoGUIを使用している最中に他の作業が出来ない(マウス、キーボードが使用できない)問題を、仮想環境(Hyper-V)を使用することで解決する手法を示す。
2023/8/22 VOCALOIDのヤマハ、AI歌声合成の実証実験スタート 新ソフト公開 ユーザーの声で改善へ
ヤマハは8月22日、試作段階のAI歌声合成ソフト「VX-β」をクリエイターに提供し、得られたフィードバックを基にソフトウェアを改善する実証実験を始めた。同社はこれまで歌声合成ソフト「VOCALOID」を独自に開発・販売してきたが、VX-βでは手法を変える。
2023/8/22 国がスマホの「サイドローディング」を義務化したい理由 内閣府の担当者に直接聞いてみた
日本政府が米Appleに対して義務化の方針を打ち出した「サイドローディング」。これが実現すれば、iPhone標準のアプリストア「App Store」以外からアプリを入手できるようになる一方、セキュリティ上の懸念が一気に高まるため義務化に反発する声は少なくない。サイドローディングに関する一連の疑問を関係者に直接ぶつけてみた。
2023/8/22 htaccessによるベーシック認証の書き方(パスワード認証)
htaccessの認証機能を利用することで、特定のURLにアクセスした場合、ページの表示前にパスワード認証機能を設けることができます。この機能によりアクセス制限することで、セキュリティーを高めることができます。
2023/8/22 Googleが「大規模言語モデルに視覚を与える仕組み」について解説、メルカリと協力して作成したデモも公開
Googleが、大規模言語モデル(LLM)に「視覚」を持たせた「大規模視覚モデル(LVM)」のデモを公開すると同時に、LVMの仕組みについての解説記事を投稿しました。
2023/8/22 YouTubeが「アーティストや作品を守りながらAIを活用するための3原則」を大手音楽企業と提携して発表
さまざまなミュージックビデオや音楽を配信しているYouTubeが、大手音楽企業であるユニバーサルミュージックグループと提携し、「生成AIを使ってアーティストやその作品を保護しながら音楽のクリエイティブでユニークな表現を強化していくための3原則」を発表しました。
2023/8/22 Python3.12からPEP692が導入され**kwargs: **TypedDict
でキーワードごとの詳細な型付けやDRY化ができるようになる
PEP695の他にもPython3.12からはPEP692が採用され、キーワード引数アノテーションに対する新文法として
**kwargs: **TypedDict
という書き方ができるようになります。それも現時点(2023/8/22現在)で日本語記事がなく、それなりにバズる需要があるのではないかと思い、この記事を書きました。
2023/8/22 AIが生成した作品は著作権で保護されない–米裁判所が判決
クリエイティブな領域における人工知能(AI)との争いにおいて、人間が1つの勝利を収めた。米連邦裁判所判事は先週、AIが生成した作品は著作権で保護されないとの判決を下した。
2023/8/22 EC2 セキュリティ グループについて学び、EC2 インスタンスへのターミナル接続を確立する。
このブログでは、このブログの後に書いています EC2 ユーザーデータを利用したインスタンスの作成(AWS)(ブログ) **https://dev.classmethod.jp/articles/ec2-creating-an-instance-using-user-dataaws /**前回のブログでは、EC2 インスタンスをセットアップしました。 ここで、基本的な理解の一環として、EC2 インスタンスをさらに詳しく見てみましょう。 このブログでは、Linux EC2 インスタンスのセキュリティ グループと EC2 への接続の確立について簡単に学びます。
2023/8/22 今から始めて追いつけるAI学習入門セット、画像生成・音声変換・AIチャット・英単語をわかりやすいムービー形式で基礎から学べる「Udemy」講座まとめ
Google DeepMindが開発したAIであるAlphaGoが囲碁の世界チャンピオンに打ち勝ったというニュースが世界を駆け巡ったのもすでに8年近く前の出来事で、AIの可能性が示されてから多数の研究者たちがAI技術の開発に情熱を注いだ結果、AI技術は飛躍的な進歩を遂げました。今ではテキストで指示するだけでいい感じのイラストを生成してくれるAIや、人間かのように言葉を操って要約や作文といったタスクをこなせるAIなどが登場しています。そうしたAIの使い方や仕組みについて、ムービー形式でわかりやすく解説してくれる講座が多数用意されているのがオンライン学習プラットフォームの「Udemy」です。ちょうどUdemyの夏のビッグセールが8月31日(木)まで開催されていて高品質な講座が1200円~で受講可能とのことなので、今からAIを学び始めるのに良さそうな講座をいくつかピックアップしてみました。
2023/8/21のピックアップ
2023/8/21 「わたしの話」を体系的に覚えてもらいながらLLMと会話する技術MemoChat登場
そこで、この記事では、最新の研究「MemoChat: Tuning LLMs to Use Memos for Consistent Long-Range Open-Domain Conversation」に焦点を当てます。この研究では、LLMが長い会話でも一貫性を保ち、人間のような対話を提供できるようにするための新しい方法が提案されています。この記事を通して、従来のLLMの課題、研究者たちの革新的なアイデア、MemoChatの方法論、実験結果、そしてこの技術がどのように私たちの日常生活に影響を与えるかについて、詳しく解説していきます。
2023/8/4 伊藤淳一氏が「一番下手くそエンジニア」から脱出した4つの方法。2023年版ITエンジニアの生存戦略【後編】
前回では、筆者がプログラマとして入社したSIer時代のエピソードと、そのあとに入社した外資系企業での社内プログラマとしてのエピソードを書いてみました。IT業界に入って間もないエンジニアさんや、これからの自分のキャリアを考え始めたエンジニアさんにとっては、少し現実味のある「生存戦略」が垣間見れたかもしれません(まだ読んでない方はこちらからどうぞ!)。さて、今回の記事では、筆者がソニックガーデンに入社してから現在に至るまでのエピソードを書いていきます。筆者がRubyプログラミングやQiita記事の投稿を始めたのはこの時期からなので、筆者のことを「RubyやQiitaで有名な伊藤さん」と認識されている方は、もしかするとこちらの方が興味深い内容になっているかもしれません。
2023/7/4 伊藤淳一氏が語る「僕の9年間の無名時代」。2023年版ITエンジニアの生存戦略【前編】
エンジニアのキャリアづくりは、スキルの積み重ねだけでなく、選択の連続でもあります。本連載では第一線で活躍するITエンジニアに、キャリアに訪れた転機との向き合い方をお話しいただきます。記念すべき一人目は、会社員として開発現場でコードを書きながら、技術本の執筆やイベント登壇などエバンジェリストとしても知られる伊藤淳一(@jnchito)氏。20年目もなお活躍の幅を広げ続けるエンジニアライフの送り方を全3回に分けてご寄稿いただきます。
2023/8/21 個人情報保護委「生成AI利用に注意」 事業者・行政機関向けにポイント解説
個人情報保護委員会は8月21日、生成AIサービスの利用に関する注意点をまとめたパンフレットを公開した。事業者や行政機関などに向けて、各提供サービスの利用者が入力した情報を、AIの学習データとして利用する予定がある場合に注意すべきことなどを記載している。
2023/8/21 開発チームリーダーとしてやってきたことのふりかえり #devio2023
DevelopersIO 2023のビデオセッションにて「開発チームリーダーとしてやってきたことのふりかえり」というテーマで発表をしました。 私が開発チームリーダーを数年続けたなかでの学びをふりかえった内容となります。
2023/8/21 Snowpark Pythonによる機械学習モデル開発をはじめるための足掛かりのご紹介(2023年8月版)
2023年8月時点での、Snowflakeのデータを使った機械学習モデル開発に必要な要素について、主にDevelopersIOの記事を中心にまとめました。
2023/8/21 Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される
デンマークの著作権侵害対策グループ「Rights Alliance」が、約20万冊にも上る書籍のデータセット「Books3」を削除するよう、ホストする「The Eye」に対して要請し、データセットの削除が行われました。Books3はMetaの開発する大規模言語モデル「LLaMA」のトレーニングにも使用されたデータセットです。
2023/8/21 老舗圧縮解凍ソフト「WinRAR」でファイルを開くだけで任意コード実行を可能にする脆弱性が発見される、すでに修正版が配布済み
Windows用のファイル圧縮・解凍ソフトであるWinRARで、RARファイルを開くだけでコンピューター上で任意のコードを実行できる脆弱(ぜいじゃく)性「CVE-2023-40477」が発見されたと報告されています。すでにこの脆弱性を修正したバージョン6.23がリリースされており、ユーザーは可及的速やかにアップデートすることが推奨されています。
2023/8/21 読まれるテックブログの極意は「書く人の心が折れない仕組み」。モノタロウのエンジニアに学ぶベストプラクティス
株式会社MonotaROのテックブログは、記事を公開するたびに多くの注目を集め、今では月間1万人が訪れるブログに成長しています。運営を担当するのは同社のエンジニア。通常業務に加えて、テックブログ運営業務として記事のテーマ選定から構成の策定、執筆者のモチベーション管理、内容のブラッシュアップまで一貫して担当し、記事の品質や更新頻度を担保しているそう。「さぞ大変なのでは」と話を聞いてみると、何やらとても楽しそうな雰囲気。運営チームの皆さんに、「バズるテックブログ」を生み続ける方法を取材しました。
2023/8/21 写真1枚から、動かせる着衣3D人体モデルを高精度に生成する技術「TeCH」 DreamBoothなどで「見えない裏側領域」をリアルに復元【研究紹介】
中国の浙江大学やドイツのMax Planck Institute for Intelligent Systemsなどに所属する研究者らが発表した論文「TeCH: Text-guided Reconstruction of Lifelike Clothed Humans」は、全身が写る1枚の写真から高精度の3D着衣人体モデルを生成する手法を提案した研究報告である。背中や後頭部などの見えない領域も一貫したテクスチャとジオメトリを持つ、忠実度の高い仕上がりで生成する。
2023/8/21 コピペしたAPI仕様書をAIが「理解」し、アプリができあがるローコード開発環境「Flowise」を試す
FlowiseAIが提供している「Flowise」は、大規模言語モデル(LLM)を使った開発のためのライブラリとして有名な「LangChain」と同様に、複数の機能を組み合わせたチャットアプリをGUIで設計できるローコードツールだ。ユーザーとチャットでやり取りする「Chat Models」や、ファイルを読み込むための「Document Loaders」、APIを呼び出すための「API Chain」など、あらかじめ用意された機能のパーツを画面上に並べ、各パーツの間を線でつないでいくだけで、複雑な処理を実現できる。
2023/8/21 PyTorch機械学習モデルのGPUメモリ消費の要因を細かくトラックする。
本記事では今更ながら、この世で一番シンプルな機械学習モデル(全結合1層)を使ってMNISTの分類課題を行い、訓練の各過程でGPU上にどれくらいメモリが割り当てられるかを確認、解釈を行った。pytorch_memlab(あるいはtorch.cuda.memory_allocated(device))で表示される、PyTorchのテンソルによって占有されているGPUメモリ消費に関して説明が可能だったので、それを雑多にまとめ、検証している。
2023/8/21 後ろからスマホをのぞかれた時だけ“画面がぼやける”システム 米研究者らが開発
米ミシガン大学に所属する研究者らが発表した論文「EYE-SHIELD: Real-Time Protection of Mobile Device Screen Information from Shoulder Surfing」は、後ろからスマートフォンをのぞき見られる行為を防止するためのシステムを提案した研究報告である。使用するユーザーには通常の画面が表示されるが、背中越しに見られた場合にのみぼやけて表示される。
2023/8/21 ジョージア工科大学でコンピュータサイエンスを学び始める話
既に先人たちが書かれている記事も多々ありますが、2023年3月にジョージア工科大学のコンピュータサイエンス修士過程に出願して合格しました。8月から授業が始まるので忘れない内に何故出願したのか、どのように出願準備したのかについてまとめようと思います。働きながら米国のコンピュータサイエンス大学院進学を考えている方々の参考になりますと幸いです。
2023/8/21 OpenCVを利用してパノラマ画像を作成する
1枚1枚の画像は画像に映るオブジェクトが少し重なるように撮影する必要がある。ざっくり言うとモジュールの中では1枚1枚の画像繋ぎ合わせる処理を行っているため、画像の重なった部分がわからないと繋ぎ合わせることは出来ないと言うことになる。
2023/8/20のピックアップ
2023/8/20 AWS WAFの基礎が学べるワークショップをやってみた
こんにちは、AWS事業本部@福岡オフィスのべこみん(@beco_minn)です。皆さんAWS WAFを使ったことはありますか?AWS WAFは名前の通り、AWSが提供するウェブアプリケーションファイアウォールサービスで、Web ACLというリソースをALBやAmazon CloudFrontディストリビューションなどにアタッチして利用出来ます。今回はそんなAWS WAFのいろはを学ぶことが出来るハンズオン形式のAWS公式ワークショップを触ってみました。内容は英語ですが、動画等のコンテンツは無いためブラウザの翻訳機能で日本語化可能です。
2023/8/20 pythonで型宣言すると便利だった
プログラミングをしていると、「この変数の型ってなんだっけ?」と疑問に思うことがしばしばある。特に、大規模なプロジェクトやチームでの開発時に、変数や関数の挙動を正確に把握することは非常に重要である。CやTypeScriptのように、型を定義できると視覚的にわかり静的型付け言語の良さを感じる。Pythonでも型を明示的に宣言するとどうなるのか試してみたところ、これが予想以上に便利だったので皆さんに共有したい。
2023/8/20 Discordに投稿された画像をGooglePhotoに保存するBotを作る
初投稿です。もし何か気づきやご意見がありましたら、ぜひフィードバックをお願いします。Lineだけでの家族内コミュニケーションに限界を感じています。Slackの無料版は90日しか履歴が残らないので、Discordが第一候補に挙がりました。Discordを理解する手段の1つとしてBot作成にトライしました。個人の備忘録も兼ねて手順を投稿します。
2023/8/20 読書をすることがメンタルヘルスやキャリアにも良い影響を与えると研究者が主張、読書習慣を身につけるためのアドバイスも
近年はTikTokやInstagramのショート動画やX(旧Twitter)の短文など、短時間で刺激が得られる娯楽が人気であり、楽しむのに長い時間がかかる読書からは遠ざかっているという人もいるはず。ところが、オーストラリア・ロイヤルメルボルン工科大学の行動経済学者である**メグ・エルキンス**氏らは、読書をすることがメンタルヘルスや仕事のキャリアに良い影響をもたらすと主張し、実際にオーストラリアの若者を対象にした研究結果を報告しています。
2023/8/20 「所有しない購入」となった電子書籍経済のあり方と今後の展望とは?
電子書籍の大きな特徴として、多くの場合で電子書籍は厳密には「書籍を購入」することはできず、「書籍へアクセスするライセンスを購入」というような形になります。そのため、紙の書籍を購入した場合には本をそのまま保存することもコピーしたり人にあげたりすることも可能ですが、電子書籍はコピーガードが付いていたり、内容が更新・変更されたり、削除されて読めなくなったりするケースもあります。そのような「反所有主義」となった電子書籍市場の特徴や現在のあり方、今後の重要な展望についてまとめた論文を、ニューヨーク大学法科大学院の**エンゲルベルクセンター**が公開しています。
2023/8/20 Windows で Python の開発環境を構築する(Poetry と pyenv を利用)
Windows をクリーンインストールしたため、Python の開発環境を Windows で構築する手順を整理しなおしました。過去の投稿で不足していた説明などを補足し、現在のバージョンにあわせて内容を更新しています。
2023/8/19のピックアップ
2023/8/19 ChatGPT開発に必要なGPUは3万基、日本の国策AI基盤は1千基。目前に迫る日本のAI敗戦
そろそろ業界の最深部でしか知られてなかった事実がニュースになって来始めているのでここで本当の問題を明らかにしておきたい。AI開発に必須なのは、計算資源である。そしてこれは現在のところ、事実上NVIDIAが一社独占している。NVIDIA以外の半導体がいくら「AIに特化しています」と能書きを垂れていてもごくわずかな例外を除いてはほとんど全部が誇大広告である。
2023/8/18のピックアップ
2023/8/18 タスクに応じてロールプレイさせるとChatGPTなどLLMの推論能力は普遍的に向上する
大規模言語モデル(LLM)の分野では、その推論能力が日々向上しています。本記事では、最新の研究「Better Zero-Shot Reasoning with Role-Play Prompting」を紹介し、ロールプレイプロンプティングがLLMの推論能力をどのように向上させるのかを探ります。
2023/8/18 GoogleのトップAI研究者2人、東京でAI企業Sakana.ai立ち上げ
米Googleの著名な2人の元研究者、リオン・ジョーンズ氏とデビッド・ハー氏が8月17日、東京に拠点を置く新AI企業を設立したとX(旧Twitter)で発表した。
Sakana AIのWebサイトには「自然からインスピレーションを得たインテリジェンスに基づいた新しいタイプの基礎モデルを開発する」とある。独自の生成AIモデルを構築するということだろう。
2023/8/18 音声アシスタントに入力中、横から“聞こえない音”で攻撃 指示を勝手に変更 中国チームが開発
中国の浙江大学に所属する研究者らが発表した論文「Inaudible Adversarial Perturbation: Manipulating the Recognition of User Speech in Real Time」は、ユーザーが音声アシスタントに音声入力している際、横から不可聴音の悪意ある音声を混ぜて異なる入力内容に変更する攻撃を提案した研究報告である。
2023/8/18 OpenAIはChatGPTを消去して作り直さなければならないかも知れない
New York Times紙がサービス利用規約(TOS)を更新し、**AI企業がAIモデルを訓練するために記事や画像をスクレイピングすることを禁止していることが明らかになった**が、どうやら事態はそれだけでは収まらないようだ。NPRの報道によると、New York Times紙とOpenAIはライセンス契約をめぐって数週間にわたり難航しているが、合意に達することはできていない。交渉は行き詰まっており、NYTは現在訴訟を検討しているようだ。NPRは、この件に関して“直接知っている”2人の匿名の情報筋の話を引用しており、訴訟の結果次第ではChatGPTのデータセットは再構築を余儀なくされ、侵害コンテンツ1つにつき最高15万ドルの罰金が科されるなど、OpenAIに壊滅的な打撃を与える可能性があると専門家は推測している。NYTの弁護士は、同紙の報道の “知的財産権を守るために”訴訟が必要かどうか熟考していることを確認しているという。
2023/8/18 Stability AIが画像を認識して日本語で回答してくれるAIモデル「Japanese InstructBLIP Alpha」をリリース
画像生成AI「Stable Diffusion」を開発するStability AIが、日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開したと発表しました。入力した画像に対して日本語で説明を生成できる画像キャプション機能や、画像についての質問を日本語で入力すると日本語で回答する機能が搭載されています。
2023/8/18 東大松尾研、日英対応の大規模言語モデル公開 100億パラメータ、精度は「国内オープンソース最高水準」
東京大学院工学系研究科・松尾研究室(主宰:松尾豊教授)は8月18日、日英の2カ国語に対応した100億パラメータサイズの大規模言語モデル(LLM)「Weblab-10B」を、事前学習と事後学習(ファインチューニング)により開発し、非商用のオープンソースでモデルを公開した。
2023/8/18 Metaがコーディング補助AI「Code Llama」の無料公開を計画中か
Metaは「Llama」や「Llama 2」といった大規模言語モデルをオープンソースで公開しています。新たに、Metaがコーディング補助向けに最適化した言語モデル「Code Llama」を開発中であることが報じられました。報道によると、Code Llamaもオープンソースで公開される予定とのことです。
海外メディアのThe InformationがMetaの関係者2人から得た情報によると、MetaはLlama 2をベースにコーディング補助に特化させた言語モデル「Code Llama」を開発中で、早ければ2023年8月中に公開する予定とのこと。また、Code LlamaはLlamaやLlama 2と同様にオープンソースで公開予定とされています。
2023/8/18 老化した脳を若返らせる血液因子が特定される、別々の研究チームがひとつの答えにたどりつき3本の論文を同時公開
若さの追求のため、これまで若者の血を輸血する研究や抗老化ホルモン「クロトー」を動物に注射する実験などが行われてきました。こうした若返りに関する数々の研究に共通する因子の特定につながる3本の論文が2023年8月16日付のNature、Nature Aging、Nature Communicationsで発表されました。
2023/8/18 海底ケーブルが2本切断されアフリカのインターネットが大混乱に陥る、ケーブル切断にもかかわらず遅延が改善されるケースも
現地時間の2023年8月6日(日)、世界最長の海底渓谷のひとつで地滑りが発生し、アフリカにインターネットサービスを提供するための重要な海底ケーブル2本が切断されました。これにより西アフリカの海岸沿いではインターネット**帯域幅が激減する事態となり、アフリカのインターネットユーザーが大混乱に陥っています。このアフリカで起きた海底ケーブル切断について、ネットワークモニターサービスやセキュリティサービスを提供するKentik**が独自の分析を公開しました。
2023/8/18 「生成AIは著作権保護の検討が不十分」新聞協会など声明 「著作権法30条の4は大きな課題」
日本新聞協会など4団体は8月17日、生成AIにまつわる著作権保護策の再検討を求める共同声明を発表した。日本の著作権法第30条の4が「諸外国に比べ、AI学習に極めて有利に作られていることは大きな課題」と指摘。AIに学習させる著作物データの保護をめぐり、権利者団体と関係当局の意見交換を求めている。
2023/8/17のピックアップ
2023/8/17 メタ認知をさせてLLMの能力を上げる手法「メタ認知プロンプティング」
この記事では、大規模言語モデル(LLM)の理解を向上させるための新しい手法、メタ認知プロンプティング(Metacognitive Prompting)について紹介します。この研究がどのようにしてLLMの理解を深めるのかについて詳しくみていきます。
メタ認知は、複雑な問題解決や意思決定における鍵となる要素であり、抽象的な概念を分解し、シナリオを批判的に評価し、推理を微調整する能力の基盤となっています。この高次認知プロセスは、人間が「思考についての思考」を行う能力を反映しています。今回紹介する研究の主要な目標は、言語モデルに人間の「思考についての思考」を模倣するメタ認知プロセスを導入することです。このプロセスは、人間の認知の段階を反映した連続した認知のステージから構成されます。
2023/8/17 今年の7月は、1880年以降で最も暑い1カ月だった──米NASAが発表 「科学的に見ても正常ではない」
2023年7月は、1880年以降で最も暑い1カ月だった──米航空宇宙局(NASA)は8月14日(現地時間)にそんな調査結果を発表した。23年7月は、NASAの記録する過去7月の最高気温より0.24度高く、1951~80年7月の平均気温と比較すると1.18度高かった。NASAのビル・ネルソン長官は「地域社会と地球を守るために今行動しなければならない」と述べている。
2023/8/17 【実践XAI①】PDPによるモデルの説明
この記事では、書籍「実践XAI[説明可能なAI] 機械学習の予測を説明するためのPythonコーディング」を参考にして、PDPで機械学習モデルを解釈する方法を解説します。
2023/8/17 日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました
Stability AIは日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。
2023/8/17 抗精神病薬が標的にするニューロンが数十年にわたり誤解されていた可能性があるという研究結果
主に**統合失調症などの症状を緩和するために用いられている抗精神病薬は、脳内の神経伝達物質であるドーパミン**を遮断することで作用します。ところが、抗精神病薬が標的にしているドーパミン受容体が過去数十年にわたり誤解されてきた可能性があると新たな研究で示され、薬や治療法の開発に大きな変化がもたらされるかもしれないと報じられています。
2023/8/17 LlamaIndexを完全に理解するチュートリアル その1:処理の概念や流れを理解する基礎編(v0.6.8対応)
本記事から数回に分けて、LlamaIndexの中身を深堀していく記事を書いていこうと思います。
2023/8/17 Googleが「AIが人生相談や個別指導、計画立案などをしてくれるツール」を開発中
GoogleのAI開発部門である**Google DeepMind**が、ジェネレーティブAIを用いて人生相談やプランニング、個人指導など少なくとも21種類のタスクをこなせるツールを開発していると報じられています。GoogleはAIソフトウェアのトレーニングと検証に特化した新興企業・Scale AIと契約し、一連のツールをテストしているとのことです。
2023/8/17 「常温常圧の超伝導体」として科学界に旋風を巻き起こしたLK-99が超伝導体ではないことはどのように明らかになったのか?
韓国の研究チームが発表した「室温かつ常圧で超伝導状態になる物質・LK-99」については、発表当初から世界中の研究者から注目が集まり、**複数の研究機関が再現実験を実施しました。最終的に、LK-99は超伝導体ではないことが明らかになっているのですが、そのプロセスを科学誌のNature**が解説しています。
ああ…ダメでしたか。不純物の特性を超伝導と誤解していた、ということのようです。残念!わたしは超伝導は詳しくないのですが、物性物理学をちょこっとやっていたので、現象を正しく理解するにはかなり綿密な実験と分析が必要で専門知識がないと理解が難しい、というのはわかります。発表した韓国の研究所は20年以上この物質の研究をされていたようですが、「まちがいだった」ということで、ずっと結果を勘違いして正されなかったということなのですね…磁化や誘電率の測定に使われる装置は液体ヘリウムが必要ですし、結晶構造を特定するにはX線回折装置が必要ですから、物性の研究をしようとすると民間の研究所では厳しいだろうと思います。しかし2週間ほどで追試がされて誤りがわかるというのは、業界が健全ということなのだろうと感じました。
2023/8/17 Javaの記法を初心者向けに大幅改良、「魅力を高めて若い世代の心をつかむ」
Javaは、企業のITシステムの開発になくてはならないプログラミング言語としての地位を確立している。一方で、PythonやJavaScriptといった若い世代に人気がある言語と比較すると、煩雑な記法が多く堅苦しいイメージは否めない。こうしたイメージを一新してJavaの生産性を高める試みが「Project Amber(プロジェクト・アンバー)」だ。同プロジェクトではこれまで、Javaプログラムの可読性を高めるために数々の記法の改良を行ってきた。
上記は有料記事で、大事なところがわからなかったので、調べてみました。
2023/6/18 Java のpublic static void main なくなるってよ。
要は 現状、初心者が勉強するには不便すぎるので、書いたらすぐに動く様にしましょう。 ってことですかね。あとは、通常の開発手法を学んでもらいたいから初心者用の特別なやり方はだめだよねというとです。
Javaはプログラミングを勉強し初めの頃に勉強したことがあるのですが、確かにPythonとかと比べると書くことが多くてめんどくさいなあと思いましたね。しかしJavaのようにきっちり書く言語の方が大規模開発には向いているんだろうなあ。このProject Amber以外にも、Javaを改良するプロジェクトが動いているようです。そうか、プログラミング言語を開発・更新している人たちがいるんですね…すごいな。
2022/9/28 進化する2022年のJava:4つの大規模プロジェクトの現状
今年はJavaにとって大きな1年になるでしょう。よく知られているように、Java 18は(JDK 18として)2022年3月22日に、Java 19は9月に一般公開される予定です。今年のJavaは、具体的なJSRを見据えながら、Valhalla、Panama、Loom、Amberという4つの主なプロジェクトを通して進化し続けます。本記事では、それぞれのプロジェクトの目的と2022年1月時点の現状、そして短期的な計画に注目します。
2023/8/17 【合格体験記】旧試験のリベンジとして新試験の基本情報技術者試験に挑戦して合格しました
2023年7月に基本情報技術者試験を受験し合格しました。基本情報技術者試験は令和5年(2023年度)4月以降から試験内容が大幅に変更されました。新試験になってからの合格体験記がまだ少ないと思うので、所感を残しておきます。
2023/8/16 Adobe Express、生成AI機能搭載のオールインワンアプリに進化
Adobeは16日、オールインワンアプリ「Adobe Express」の最新バージョンを提供開始した。画像生成AIの「Firefly」を搭載し、日本語プロンプトでの画像生成などに対応する。Adobe Expressは、テンプレートから作りたい文書を選んで、シンプルかつ簡単にデザインを行なえるオールインワンのコンテンツ制作アプリ。新たに生成AI機能の「Adobe Firefly」(ベータ版)を内蔵したことで、テンプレートだけでなくプロンプト(テキスト入力による指示)で画像を生成し、デザインに活用できる。
2023/8/16 パブリックなIPアドレスを経由してEC2インスタンスへSSH接続するポイントをまとめてみた
EC2インスタンスの一部のAMIには、SSMエージェントがデフォルトでインストールされています。そのためSSH接続を行わずとも、AWSのマネジメントコンソール上からセッションマネージャー経由でコンソールにアクセスできます。しかし、SSMエージェントがインストールされていないAMIでEC2インスタンスを立てた場合は、セッションマネージャーは使えません。コンソールへのアクセスやSSMエージェントのインストールのために、EC2インスタンスにアクセスする必要があります。EC2インスタンスにSSH接続するためには、いくつか確認するべきポイントがあります。今回はこれらのポイントを整理してみましょう。
2023/8/16のピックアップ
2023/8/16 AIの進化でボットの方が人間よりも高速かつ高精度でCAPTCHA認証を突破することが可能に
インターネットでサービスを利用を行う際、自身がロボットでないことを証明するために「CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)」というテストを要求されることがあります。CAPTCHAについて調査を行ったカリフォルニア大学の研究チームによる実験で、CAPTCHAテストの解読速度や正答率は人間よりもボットの方が優れていることが判明しました。
2023/8/16 京セラ、音声をアクリル板に字幕表示する「コトパット」
京セラドキュメントソリューションズジャパンは、京セラが開発し、実証実験を重ねてきた「わかりやすい字幕表示システム」を、「Cotopat(コトパット)」と名付け、8月17日から販売を開始する。Cotopatは、話した言葉をリアルタイムに認識して、文字・図解・動画をスクリーンに表示することで、会話の聞き取りづらさを解消し、コミュニケーションを円滑にするシステム。特に聴覚障がいのある人や高齢者は、コロナ禍でのマスクやアクリル板を介した会話の聞き取りづらさなどからコミュニケーションを円滑にできないと感じる事も多い。そうした課題を解決するため2021年に京セラが開発した。
2023/8/16 脳波から「聞いていた音楽」を再構成することに成功、再構成した音楽を聴けるムービーもあり
カリフォルニア大学バークレー校の研究チームが脳波を分析して「聞いていた音楽」を再構成する技術を開発しました。開発された技術では音階の変化やフレーズの一部を判別可能なほど鮮明に音楽を再構成できます。
2023/8/16 住所の“表記ゆれ”を正規化する自動変換サービス「クイック住所変換」提供開始~Geolonia
株式会社Geoloniaは8月16日、住所正規化および緯度・経度追加サービス**「クイック住所変換」**を提供開始した。クイック住所変換は、住所データを取り扱う際に課題とされている“表記ゆれ”を解決するウェブサービスだ。表記ゆれの住所を含むExcelファイルをアップロードすると、統一されたフォーマットの表記に正規化された住所をダウンロードできる。正規化済み住所には、緯度・経度の座標を付与する“ジオコーディング”の処理も行われる。
2023/8/16 リチウムイオン電池よりも安全で高効率なリチウム金属電池の実現につながる可能性がある根本的な発見が明らかに
リチウムイオン電池は、PCやスマートフォンなどの電子機器に利用されていますが、多くの研究者がバッテリーの性能向上を図るために、「リチウム金属電池」の研究開発を進めています。カリフォルニア大学ロサンゼルス校の研究チームが、特定の条件下でリチウム原子が一定の形を示すことを明らかにしました。この発見は、リチウム金属電池の安全性を高めることができる可能性が期待されています。
2023/8/15のピックアップ
2023/8/15 kaggle飛行機雲コンペ 上位解法まとめ
衛星画像から飛行機雲のセグメンテーションを行うGoogle Research – Identify Contrails to Reduce Global Warmingというkaggleコンペが2023/8/10まで開催されていました。コンペ終了後に公開された上位解法からたくさん学びがあったので、備忘録も兼ねてまとめていきたいと思います。
2023/8/13 生成AIの生成性(Generativity) :徳井直生の『続・創るためのAI』
変化の速いAI技術の波に乗り、翻弄され、ときに抗いながら、AIとわたしたちの関係の望むべき未来像を考察していく、アーティスト・徳井直生による新連載。第1回は、現在のAI技術が矮小化されている原因や、生成という言葉/概念がもっていた豊穣な可能性をひも解いていく。
2019/5/1 「刺身にわさび」はいつからか?
和食がユネスコ無形文化遺産に登録されたのは、2013年12月4日。世界に知られるようになった和食、ことに寿司や刺身には、わさびの存在が欠かせない。しかし、日本人はどれほどわさびのことを知っているのだろうか。
私は,2014 年 4 月から拓殖大学工学部基礎教育系列に所属していて,1 年生に物理を教えています.前期に力学の講義を行い,執筆している現在,後期の電磁気学の講義を行っています.その他,通年で物理実験の指導をしています.これまで素粒子論の研究を行っており,拓殖大学に採用されるまでは,高エネルギー加速器研究機構(KEK) で研究員をしていました.そのときに非常勤講師として力学を教えた経験はありましたが,本格的に教育に取り組むのは初めての経験です.拓殖大学の学生の平均学力は,いわゆる大学全入時代の典型的レベルの 1 つなのかもしれません.これまで研究中心の生活を送ってきた私は,そのような学生に接して,いろいろ感じることがありました.特に,表題に記した,物理ができないとはどういうことなのか,ということについて,常に考えさせられることになりました.
2023/8/15 大規模言語モデルのセーフガードを故意に突破する「脱獄プロンプト」とは
GPT-4などLLMには安全面、倫理面から禁止されている使用方法があり、運営はセーフガードを実装して技術的に乱用を防いでいます。しかしセーフガードは万能ではありません。本記事ではセーフガードを突破する悪意あるプロンプト手法脱獄プロンプトについての調査結果を紹介します。
2023/8/14 ミリ波レーダーで睡眠や心拍数をモニタリング 寝室見守りデバイス「ポム」のすごいところ
米国サンフランシスコのITベンチャー、Tellusとソースネクストが協業し、世界に先駆けて日本で展開することとなった非接触型の寝室見守りデバイス「POM」(ポム)。ミリ波レーダーで寝ている人の睡眠習慣や心拍数までもモニタリングできるという、この製品に見守られてみました。
2023/8/14 IntelのCPUに発覚した新たな脆弱性、Downfallについて
影響するCPUは2015年のSkylakeから2020年のTiger Lakeまでと、かなりの長期間にわたります。ということで以下は公式?の紹介サイト、Downfall Attacksの紹介です。
2023/8/14 LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK
LINEは8月14日、日本語に特化した大規模言語モデル(LLM)「japanese-large-lm」を発表した。オープンソース(OSS)として公開し、商用利用も可能(Apache License 2.0)としている。
2023/8/15 AWS Dev Day 2023 Tokyoで、エンジニアとマネージャーのキャリアについて話してきました
今回はじめてAWS Dev Day 2023のCFP(Call for Proposals:発表内容の公募)に応募して、無事採択されました。そして、2023年 6 月 22日(木)にリアルの会場で300人近い人達の前で登壇してきました。CFP応募から、当日のメインテーマ、またリアル登壇について書いておきます。
2023/8/15 Amazonが「大量のカスタマーレビューをAIが要約してまとめる機能」を導入することを発表
大手通販サイトのAmazonが**2023年6月頃からテストを行っていることが報じられていた**「ユーザーが書いたレビューの文章をAIが要約してまとめる機能」が、2023年8月14日、アメリカの一部のユーザーを対象に正式サービスを開始しました。
2023/8/15 ガバメントクラウドの選定要件、見直しへ “国産クラウド”に追い風
デジタル庁は、政府の共通クラウド基盤「ガバメントクラウド」の選定基準を見直す方針だ。これまでの技術要件は要求事項が多岐にわたり、1社で基準を満たせるのは米大手ベンダーのみという状態だった。しかし8月下旬に実施予定の公募では、他社製のものなど複数サービスを組み合わせることで要件を満たす形態を認め、これまで参入できなかった国産クラウドサービスも参入しやすくするという。同庁が8月15日に明らかにした。
2023/8/15 AIを使う=盗作? 「AIに感じる気持ち悪さ」と「AI時代の作品の説得力」をプロカメラマンが整理する
さまざまなシーンでAI利用に対する反発が見受けられますが、「AIを使う→即盗作」なのでしょうか? これはあくまで個人的な感触でしかないのですが、こうした考え方や意見の発信は、作り手だけでなく受け手からも多いように感じています。クリエイターとして作品を発信する上で、AIと、そして人といかに向き合うべきかについて、自分の考えをこの記事で整理してみます。
2023/8/15 AIの住民が勝手に会話して交流する2D RPGっぽい箱庭シミュレーター「AI Town」
生成AIの進歩によって、人間が一から文章を書いたり絵を描いたりしなくても、文章や画像を簡単に自動生成することができるようになりました。「AI Town」はAIによってさまざまな性格を持った住民が勝手に動いて自動で会話したりコミュニケーションを取ったりする2D RPGっぽい見た目の箱庭シミュレーターで、オープンソースで開発されています。
2023/8/15 “相対性理論”を100分間学べば、3分で説明できる? NHKが検証 挑戦者はサンシャイン池崎さん
相対性理論を100分間本気で学べば、3分で人に説明できるか?──そんな検証番組をNHKが8月20日に放送する。番組名は「朝までラーニング! #相対性理論~100分後にE=mc^2を説明するサンシャイン池崎~」。お笑い芸人・サンシャイン池崎さんが100分間の授業を受けた後、“推し”のアイドル・小池美波さん(櫻坂46)に3分間で相対性理論を説明できるか検証する。
2023/8/15 雨のエネルギーを発電に利用するためのブレイクスルーが発表される、ソーラーパネルならぬ「レインパネル」が登場か
近年は太陽光や風力といった自然界の再生可能エネルギーを発電に利用する試みが進んでおり、中には「空から降ってくる雨も発電に利用できるのでは?」と考えたことがある人もいるはず。実際、以前から雨を利用した雨滴発電は考案されていたものの、スケールアップが技術的な問題によって妨げられていたとのことですが、新たに中国の研究チームが雨滴発電のブレイクスルーを達成したと発表しました。
2023/8/14のピックアップ
2023/8/10 Google Colab で Japanese StableLM Alpha を試す
「Google Colab」で「Japanese StableLM Alpha」を試したので、まとめました。
2023/8/12 文化祭で某チェーン店を再現して失敗した話
はじめまして、高校2年のNaYuです。今回は文化祭で派手に失敗した話をさせて頂きます。血反吐を垂れ流しながら書いていましたが、もし皆さんが文化祭を経て「この人のしたことをしなくて良かった~」なんて言っていただければ幸いです。(
人の不幸は蜜の味)
2023/8/12 新機能「miibo webhooks」をリリース!miibo製の会話型AIをあらゆるサービスと連携させることが可能になりました🔥
こんにちは、株式会社miiboのmaKunugiです。会話型AI構築プラットフォーム「miibo」を開発しています。本日、miiboに「miibo webhooks」という待望の新機能が搭載されました🎉miibo webhooksは、miiboで作成した会話型AIと外部サービスを連携させることができる機能です。
20223/3/30 モンテカルロ法の基本をわかりやすく説明してみた|マルコフ連鎖モンテカルロ法(MCMC)まで
・モンテカルロ法が全く理解できない…難しすぎる…
・マルコフ連鎖モンテカルロ法とモンテカルロ法って何が違うの??
本記事では、上記の悩みと疑問に答えていきます。確かに、モンテカルロ法は新しい考え方がたくさんあり、混乱する気持ちはわかります。そこで、本記事ではモンテカルロ法の基本を確実に理解できるように、具体例を使用して解説しました。さらに、モンテカルロ法の基本的な考え方からマルコフ連鎖モンテカルロ法までを自然に理解できるように心がけました!
2023/8/9 インポート機能を改善し、noteからのインポートの際に画像インポート等も行えるようにしました
はてなブログでは、インポート機能を改善し、noteのエクスポートデータの形式に合わせてインポートできるようにしました。今回変更されたのは、以下の4点です。
・noteから画像を取得して、画像のインポートができるようにしました
・YouTubeとVimeoの動画へのリンクを動画プレーヤーとして変換するようにしました
・noteのルビ記法を、ルビ表示に関連するHTML要素に変換するようにしました
・noteからのインポートの場合、文字コードの選択をせずにインポートできるようにしました
自然言語処理とは、人間が自然に使っている英語や日本語などの言語をコンピュータで処理する技術です。ウェブ、メール、SNS 等、私たちの周りには自然言語で記述された文章が溢れていて、様々な情報や価値が含まれています。 しかし、その量は膨れあがり、人間が目視で内容を確認し対応することは困難になってきています。 自然言語処理技術で、これら膨大な文章を人手によらず判断、抽出、検索、変換し、適切なアクションにつなげることができます。そして深層学習の登場により、その性能が飛躍的に向上していることはウェブの翻訳サイトなどを通じ皆さんも体感していることでしょう。本連載は手を動かしながら自然言語処理技術を学びたい人、システムに組み込んで役立てたい人を対象にしています。 BoW、TF-IDF のような基礎から BERT をはじめとした深層学習を用いた最新手法まで、日本語で動作させるサンプルコードを交えながら紹介していきます。
2021/7/17 本当は奥が深いSoftmaxとそのお仲間達
機械学習やってます!という方は,きっとsoftmaxに日頃お世話になっているだろう.しかし多くの方は,「softmaxを使えば,ニューラルネットとかで分類問題解けたりするんでしょ?」程度の理解ではないだろうか?私もそうだ.使えれば何でも良い.しかしこの記事では,softmaxについて少々深掘りをしてみたいと思う.本記事の流れとしては,argmaxを導入し,softmaxをラグランジュの未定乗数法で導出し,出力がスパースになるsparsemax,それらの一般化であるentmaxを紹介したいと思う. おまけとして,温度付きsoftmaxとGumbel-softmaxも入れたので,適当に興味あるところだけでも読んでくれると嬉しい.
2023/8/8 【世界初】乳がんの原因を突き止める「思春期の遺伝子変異」京都大学研究グループ
京都大学などの研究グループは、「乳がんの大本となる乳腺細胞の最初の遺伝子変異が思春期前後に起きていることを世界で初めて突き止めた」と発表しました。この内容について甲斐沼医師に伺いました。
2020/9/21 Category Encodersでカテゴリ特徴量をストレスなく変換する
前回はfeaturetoolsを使って、簡単に特徴量の自動生成をする方法を記事にしたが、記事冒頭に記載しているCategoryEncodersの方が地味によく使っている。いや、なんだったら本当はこっちのCategoryEndodersの方が特徴量生成をする上では重要なんじゃないかとすら思っている。
2023/7/30 データコンペでCode Interpreter片手に戦ってみたけど惨敗でした
コンペの内容は、中古バイクの販売価格を予測するというテーブルコンペで、1日(8時間)という期間で競うコンペでした。コンペは、SIGNATEさんのコンペに参加したくらいで、まともなデータコンペは、ほとんど初めて(一応、サブミットはできて、PublicとPrivateの違いはわかる程度)の初心者でした。一方、参加者は、Kaggleグランドマスターが複数名、Kaggleマスターが複数名、エキスパート多数という異常なハイレベル(ていうか、グランドマスターってそんなポコポコいるものなの??)これはチートせざるをえないということで、覚えたてのChatGPT Code Interpreterを武器に戦うことに。ある程度使えるので、これはいいところまでいけるんじゃないか??と淡い期待を抱いていました。
2023/8/2 ABEJA、LLMを実用的に活用しDXを推進できる人材を育成するプログラム「ABEJA LLM Business Camp」の提供を開始
ABEJAは、2018年よりGenerative AI(生成AI)の一つであるLLMにおける研究開発を進め、2023年3月以降は、「ABEJA LLM Series」をABEJA Platformに搭載し、顧客企業に提供してまいりました。現在、ABEJAは、顧客企業のニーズを具現化するLLMの実装を実現すべく、サポート領域をより広範囲に拡大し、戦略策定やビジネスプロセスの構築、ビジネスプロセス上での運用まで、一気通貫で顧客支援を実施しており、その一環として、LLMの活用を前提とした戦略策定やビジネスプロセスの構築などのプランニングを担える人材育成をサポートしております。ABEJAは従来、顧客企業ごとに異なる個々の課題やニーズに合わせた人材育成プログラムを開発し提供してまいりましたが、このたび、対象を顧客企業以外にも広げ、DXをご担当する社員様が個別でご参加いただける人材育成プログラム「ABEJA LLM Business Camp」の提供を開始する運びとなりました。初回は、8月24日(木)ならびに31日(木)の2日間にわたり開催いたします。また、同時にエンタープライズ企業を対象に、個別企業やユースケースごとにカスタマイズした集合研修向けパッケージの提供も開始いたします。
2023/7/27Japanese MiniGPT-4: rinna 3.6bとBLIP-2を組み合わせてマルチモーダルチャットのモデルを作る
今回の記事では,rinnaで行われているjapanese-gpt-neox-3.6bを用いたマルチモーダルチャットの取り組みについて紹介します.現在は上述のMiniGPT-4の手法をベースに,japanese-gpt-neox-3.6bとBLIP-2を組み合わせたJapanese MiniGPT-4を作成しています.以降,MiniGPT-4の概要,MiniGPT-4でjapanese-gpt-neox-3.6bを利用する方法,学習データの概要,学習ずみのモデルの動作例について説明します.この記事の内容を参考にMiniGPT-4とjapanese-gpt-neox-3.6bを組み合わせて任意のデータで学習していただくことで,日本語のマルチモーダルチャットのモデルを構築することが可能になります.
2023/7/12 2023 Vol.1『生成AIがもたらす未来: 企業導入の原則』
チャットGPTのサービス開始以降、生成AIに注目が集まっています。日本でも様々な企業における導入のニュースが相次いでおり、今後の動向にはまだ不透明な部分もありますが、企業は「生成AI活用の是非」ではなく、「生成AIとどう向き合い、どう活用していくか」を検討する段階に入ったと言えます。ベインは2023年2月のオープンAIとの戦略的パートナーシップ発表以降、国内外の1,000社近い企業と生成AIの活用について議論を続けており、特に生成AIの具体的な活用機会(ユースケース)やそのインパクト、あるいは正しい活用のための組織のあり方などについて、実践的なアドバイスを提供しています。本稿では、企業経営に対する影響や導入時に検討すべき事項について、先行事例も参照しながらご紹介いたします。
2023/7/25 機械学習を「社会実装」するということ 2023年7月版 / Social Implementation of Machine Learning July 2023 Version
機械学習を「社会実装」する際に待ち受けている罠と、その解決方法の考察 (2023年7月版) です。今回は、LLM等の生成AIの進化が加速し実用化フェーズを迎えた激動の時代において、機械学習プロジェクトに取り組む私たちに何ができるか?といった内容を盛り込みました。※この資料は、東京大学メタバース工学部リスキリング講座プログラム グローバル消費インテリジェンス寄付講座 (GCI) 2023 Summerの講義で使用したものです。
2023/7/22 OpenAI API サンプルコード・ラッパーまとめ
参考になりそうなコードのまとめです。
2023/7/21 ChatGPT – Azure OpenAI 大全
ChatGPTとAzure OpenAIサービスについて纏めた132ページ資料です。一部デモ動画が含まれる部分は動きませんがご容赦ください。随時更新していきます。
2023/7/21 Bardのようなimage2textAIを構築して動画検索システムを作る
Turing株式会社の自動運転MLチームでインターンをしている東大B4の中村です。突然ですが、web検索のように簡単に、ストレージ内に保存されている、日時以外のメタ情報のない動画が検索出来るようになったら幸せになれると思いませんか? 例えば「赤信号で車が停止している」という検索クエリに対して、実際に赤信号で停止している動画が返ってきたら、簡単にそれを信号検知+停止のモデル学習に使えるようになります。今回私が開発した動画検索システムはこれをAIの力を借りて実現しました。これにより、格段に動画検索の利便性が増し、より多様な動画を簡単に使用できるようになりました。今回はそのシステムについて紹介します。
2023/6/19 新卒データサイエンティスト1年目の過ごし方 ーアンケート結果から見える入社後の働き方ー
はじめまして、2022年に新卒社員として入社しましたアナリティクス本部の見上です。今回は「新卒データサイエンティストの1年目の過ごし方」をご紹介します。ブレインパッドに新卒で入社した社員はまず、4~6月の3ケ月間でビジネス・技術系の研修およびミニプロ(※1)を実施し、それぞれの職種で仕事をするための基礎の基礎を学びます。その後の約半年間はOJT(On-the-Job Training)期間です。この時期は、新卒社員も実案件に配属され、PM(プロジェクトマネジャー)や先輩方とともに仕事をしながら一人前になるための訓練を積みます。本記事では、「データサイエンティストのOJT」に着目し、皆さんにいろいろな情報をお届けしたいと思います。OJTと言っても、配属案件が新卒社員ごとに異なるためそこでの学びもさまざまです。そこで今回はアンケートを実施し、22年入社の新卒データサイエンティストのOJTの様子をまとめてみました。
2020/2/29 『ベイズ推論による機械学習入門』のノート:記事一覧
『ベイズ推論による機械学習入門』の学習時のノートです。基本的な内容は「数式の行間を読んでみた」とそれを「RとPythonで組んでみた」です。「数式」と「プログラム」から理解するのが目標です。この記事は、各節の記事へのリンクページです。省略してある内容等ありますので、本とあわせて読んでください。初学者な自分が理解できるレベルまで落として書き下していますので、分かる人にはかなりくどくなっています。同じような立場の人のお役に立てれば幸いです。
2023/7/24 2023前半kaggle参戦記
今年開催された2つのテーブルコンペであるGoDaddy、PSPにて、それぞれソロ参加で銀メダル(152/3547位、49/2051位)を獲得し、Competitions Expertに昇格しました。この記事ではコンペで得られた知見や、自分がどのように戦ったかなどをまとめていきたいと思います。Expertを目指して頑張っている方や、機械学習コンペに興味を持っている方などの参考になれば幸いです。
2011/3/25 SQLとの付き合い方
先日、会社のメンバーから「SQLのJOIN文を視覚的に理解する」というサイトを紹介されました。SQLのJOIN文を視覚的に理解する | IDEA*IDEAおいらも見てみたのですが、「自分がSQLを書いたり読んだりする時はこんなベン図を思い浮かべることはまずないなあ」というのが正直な感想でした。そこで、おいらがSQLを書いたり読んだりする時の思考過程をアウトプットするとどうなるだろうかと考えてみました。
2023/8/8 統計検定準1級のモチベーションの保ち方
はじめまして。情報系修士一年のkanure24です!先日統計検定準1級に一発で合格しました。準1の勉強法は既に多く存在するため、この記事では準1の勉強の中でつまづきやすいポイントをまとめました。モチベーションの維持の参考になれば幸いです。
2023/8/8 明らかになったGPT-4の秘密
「競争と安全上の理由から」学習データやアーキテクチャが非公開だったGPT-4について、2023年6月になってリークがありました。そのリーク内容とは、同モデルは**2,200億パラメータの専門家モデルが8つ連結された「専門家混合モデル」**だったというものです。このアーキテクチャ自体は、Googleが2021年に発表している何ら革新性のないものです。実際には既存技術を活用して開発していたGPT-4の詳細を非公開としたOpenAIのビジネス戦略について、ロメロ氏は以下のような3つのメリットがあったと指摘しています。
2023/8/11 Kaggle Grandmaster になるまでの振り返り
はじめまして、tkです。初記事です。Kaggle Grandmasterになることができたので、私のコンペの取り組み方や振り返りを書こうと思います。取り組み方などがKaggleをやっている方のお役に立てると嬉しいです。
大阪の国公立大学の情報系M1で、画像系のコンペを中心に参加しています。 2021年5月にindoorコンペで初メダル(銅)を取り、2022年1月にKaggle Masterに昇格、2023年6月にKaggle Grandmasterになりました。
2022/11/27 『現代数理統計学の基礎』章末演習問題解答 (答案)
『現代数理統計学の基礎』(久保川達也 著)の章末問題の答案を作成する.略解は久保川先生がこちらのサイトに掲載して下さっているが,「略解」なだけあって途中式がかなり端折られていたり,エレガントすぎて凡人では思いつきようのない解答だったりするので,多少計算がゴツくなったとしても庶民的な答案を心がける.また必要に応じて答案とは別に必要な知識の確認を行う.
統計学 標準演習100選 〜確率、推測統計、回帰、応用、数理統計学〜
統計学の理解にあたって行っておくとよい重要な演習について、100題を厳選して取りまとめを行う予定です。それぞれの主要トピックの導出の流れを取り扱ったり、解答・解説ありきで作成を行なったりなど、理解度の確認用の問題ではない場合も多いので、1周目については解答を読みながら理解する形式で進めると良いと思います。解法を抑えて類題が解ければ十分なものが多いです。
2023/8/12 ChatGPT In Trouble: OpenAI may go bankrupt by 2024, AI bot costs company $700,000 every day
OpenAI spends about $700,000 a day, just to keep ChatGPT going. The cost does not include other AI products like GPT-4 and DALL-E2. Right now, it is pulling through only because of Microsoft’s $10 billion funding
(翻訳)OpenAI は、ChatGPT を維持するためだけに 1 日あたり約 70 万ドルを費やしています。このコストには、GPT-4 や DALL-E2 などの他の AI 製品は含まれません。現時点でそれがうまくいっているのは、ひとえに Microsoft の 100 億ドルの資金のおかげです。
2022/12/15 Streamlit と Cloud Run でデータ可視化ダッシュボードを爆速デプロイする
こんにちは、データ報道グループの並木です。業務では主にデータジャーナリズムと呼ばれるデータの分析や可視化に根ざした記事の執筆にあたっています。最近趣味でクラウドサービスの勉強をしており、今回は休日に取り組んだダッシュボード開発の内容を解説します。
2023/8/14 Metaの研究者ら「GPT-4をきびしくサポートする」AIのShepherd(シェパード)開発
この記事では、Metaの研究である「Shepherd」について紹介します。Shepherdは、GPT-4などテキスト生成AIに対する批評家として機能するモデルです。この記事では、Shepherdの全体的な概要、技術的な側面、有効性の検証、議論、そしてその意義について紹介します。
Shepherdは、GPT-4などテキスト生成AIに対する批評家として機能するモデルです。特定の問題を指摘し、改善のための具体的な提案を行うことができます。このモデルは、事実の正確性、論理的な誤り、一貫性、整合性などの特定の問題を特定し、深いドメイン知識から具体的な改善案を提供することができます。
2023/8/14 ABCIの大規模言語モデル分散学習ハッカソンを振り返る
7月6日〜14日の9日間、ABCIの主催で 第1回大規模言語モデル分散学習ハッカソン が開催されました。自分はいいだしっぺ 兼 チューターとして参加したのですが、今回のイベントは個人的な学びも多かったし、なにより楽しかったので、忘れないうちに振り返っておこうと思います。
2023/8/14 「ChatGPT」のカスタム指示、無料プランでも利用可能に
自分が理想とする回答を「ChatGPT」から引き出すための完璧なスキルを習得するのは難しい。通常は、求めていた最終結果にたどり着くために、最初の質問を慎重に作成した上で、さらにいくつかのプロンプトを重ねる必要がある。OpenAIは7月下旬、この問題を解決するための**「custom instructions」(カスタム指示)機能**を発表した。この機能では自分の好みをあらかじめ設定することにより、ChatGPTの回答を調整できる。
2023/8/13のピックアップ
2023/8/13 まだOpenAI使ったことないの?この記事で全員ハンズオンさせてやんよ!
昨今ちまたで話題の OpenAI。chatGPT はさらっと触ったけど、API までは触ってないなぁ…という方向けのハンズオン 🖐️ となります。この記事の目標としては、OpenAI を触ってみたい全てのアゲアゲエンジニアがハンズオン出来ることです。セットアップで詰まるところはどんどんコメント欄に質問していただいたら、がんがん返していきますので、ご遠慮なく質問してください!
2023/8/13 民主主義を改善するためにAIを活用する方法とは?
AIによって高精度な文章を人間よりも圧倒的に短い時間で生成できるようになったことで、「AIが生成したパブリックコメントが政治に影響を及ぼすのではないか」「AI製のフェイクニュースが拡散され民主主義をゆがめるのではないか」といった懸念が浮上しています。そんな中、著名な情報セキュリティ専門家でありハーバード大学ケネディスクールの公共政策学講師も務めているブルース・シュナイアー氏が、「AIは民主主義を強化することができる」と主張しました。
2023/8/12のピックアップ
2023/8/12 Python(pytest)でテスト書くならfixture,conftest,parametrizeを理解すると世界が一気に変わる
Pythonのテストライブラリといえばpytestが一般的です。Python標準のuniitestとは異なり、クラスベースではなく関数ベースでテストコードを記述することが一般的ですが、fixture,conftest,parametrizeを理解すると一気に世界が変わり、テスト体験が圧倒的に向上するため、これらの実装方法を紹介します。
2023/8/12 トーマツ、AIで不正会計を検知 300社の財務データ学習
監査法人トーマツは9月にも、人工知能(AI)を使って企業の財務情報を監査する取り組みを本格的に始める。過去に誤りや不正があった企業の財務報告書を学ばせることで、監査先企業の不正リスクを探り当てる。企業の不適切会計が増える中、AIを活用して効率的な監査をする動きが広がってきた。
2023/8/12 ChatGPT(GPT-4)に質問できるSlack BotをAWS Lambda(OpenAIライブラリなし)で作成してみた
n番煎じではありますが、タイトルの通りChatGPTに質問できるSlack botを作成しました、というものです。せっかくなのでGPT-4を使用します。よく見かける事例では、OpenAI公式のライブラリを用いた実装例が多い印象ですが、それをあえて使わずにAWS Lambda(Python)標準のままで作成する方法をまとめました。
2023/8/12 ファスナーの王様「YKK」はどのような歴史をたどってきたのか?
日本発の非鉄金属メーカー・**YKK**は、アメリカで生産されていたファスナー(ジッパー)をいち早く取り入れて成長し、世界の市場シェアの約40%を占める巨大企業になっています。こうしたYKKがどのような歴史をたどってきたのかについて、主にアジアに関する経済・歴史の動画を投稿するYouTubeチャンネル・asianometryが解説しました。
2023/8/12 世界中の狩猟採集社会では女性も狩猟に参加している、「男性が狩り、女性が採集」という明確な分担があるわけではないという研究結果
農耕ではなく野生動物の狩猟や動植物の採集を生活の基盤にする**狩猟採集社会**においては、伝統的に「男性が狩猟を担当し、女性が採集を担当する」という性別に基づいた役割分担があるという考えが根強くあります。ところが、現代まで存続する60以上の狩猟採集社会について調べた研究では、80%の社会において女性も狩猟に参加していることが判明しました。
2023/8/11のピックアップ
2023/8/11 拡散モデルを使用して白黒画像をカラー化する「Color Diffusion」
白黒画像をカラー化する「Color Diffusion」のプロジェクトがGitHubにて公開されています。ErwannMillon/Color-diffusion: A diffusion model to colorize black and white imageshttps://github.com/ErwannMillon/Color-diffusion
2023/8/11 【全録】Microsoft Edgeに閲覧したすべてのページのスクリーンショットを保存する機能が追加へ
Microsoft Edgeのプレビュー版で、閲覧したWebページのスクリーンショットを自動的に保存する新機能のテストが行われていることがわかりました(gHacks)。この機能はMicrosoft Edge Dev/Canaryの一部のユーザーを対象としてテストされていて(手元の環境では確認できず)、デフォルトでは無効化されています。
2023/8/11 生成AI学習データ、事業者に開示指針 政府が骨子案
政府が年内にまとめる人工知能(AI)の事業者向け指針の骨子案が11日、分かった。開発から活用の5段階で企業が守るべきルールを示す。生成AIがどんなデータを学習したかの開示などを求める。産業競争力向上につながるAIの適切な利用に向け、ルールを設けて透明性を高める。
2023/8/11 ドコモがつながらない「パケ詰まり」は政府の方針転換が原因か。通信品質の低下がドコモだけな理由とは(石野純也)
都市部を中心に品質が大きく低下していたドコモのネットワークですが、同社は4月に対応策を発表。7月28日には、つながりにくさ・遅さの象徴とも言えるスポットだった東京の渋谷、新宿、池袋、新橋での改善状況が明かされました。以前、この連載でも取り上げたように、人流の戻りや地形の変化などがその原因。単純に言えば、増加したトラフィックを混雑エリアでさばききれなくなったということです。ドコモの「パケ詰まり」はなぜ起きているのか。都市部の一部混雑エリアで発生中、今夏までに改善目指す(石野純也)
2023/8/11 「なぜ私たちはいつも締め切りに追われるのか」──東大松尾教授が2006年に出した論文が話題
なぜ私たちはいつも締め切りに追われるのか──そんなタイトルの論文がX(元Twitter)上で話題になっている。筆者は、日本のAI研究の第一人者である東京大学の松尾豊教授。そんな松尾教授が産業技術総合研究所の研究員だった頃に書いた研究報告だ。
2023/8/10 画像生成AI「Stable Diffusion」の開発元・Stability AIで幹部やエンジニアが相次いで辞任、CEOのリーダーシップが問われる
画像生成AI「Stable Diffusion」などの開発で知られるAIスタートアップ「Stability AI」が、競合他社の発展や主要幹部やエンジニアの相次ぐ辞任によって、開発資金の調達に苦しんでいることが報じられています。
2023/8/10 「いらすとや」風画像を無限に生成 「AIいらすとや」商用利用可に 有料サービス化
AI画像生成サービスを提供するAI Picasso(東京都港区)は8月10日、フリー素材サイト「いらすとや」風のイラストを生成できる「AIいらすとや」の正式サービスを始めた。これまで公開していたβ版では、生成した画像の用途がSNSへの投稿のみに限られていた。今後は、同社の有料サブスクリプション(月額1480円)に登録すれば、無制限に画像を生成し、全てクレジットなしで商用利用できる。
2023/8/10のピックアップ
2023/8/10 AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox)
最近AnimateDiffというAI動画手法がすごいと各所で注目されています。テクノエッジで連載している生成AIウィークリーで7月17日に取り上げているのですが、すぐにいろんなところで実装され、Stable Diffusion WebUIで使えるようになり、さらに日本のAI作画サービスであるMemeplexでも利用できるようになりました。
2023/8/10 エレコム、過去発売のWi-Fiルーターに脆弱性 更新期間終了済み、“買い替え”推奨 「力及ばず謝罪しかできない」
エレコムは8月10日、過去に販売していた一部Wi-Fiルーターに脆弱性が見つかったと発表した。対象製品は2017年2月以前に発売したもので、いずれもすでにアップデートサービスを終了している。悪用された場合、攻撃者によって任意のコマンドが実行される可能性があるため、同社は代替製品への切り替えを勧めている。
2023/8/10 Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開 他社上回る性能、商用利用も可能
英Stability AIの日本法人であるStability AI Japan(東京都渋谷区)は8月10日、日本語特化の大規模言語モデル(LLM)「Japanese StableLM Base Alpha 7B」を公開した。パラメータ数は70億。ライセンスはApache License 2.0で、商用利用可能だ。
2023/8/10 完全フルリモートの弊社がMetaLife(バーチャルオフィス)を導入してみて感じてること
ただ、やはり思うのは業務以外のことで人と話す機会が極端に減り、メンバー間の関係性の構築という部分が非常に弱くなったのは事実なのかなと思います(中略)この問題を解消するため、MetaLifeというバーチャルオフィスツールを試験導入し、メンバー間コミュニケーションを活性化させようと試みた結果を、導入約1週間というところで途中経過としてみなさんに共有したいなと思い本記事を作成しています
2023/8/10 「自社製品にチャットAIを組み込みたい」 企業が取るべきセキュリティ対策とは? “プロンプトインジェクション”の基本手口
チャットAIをサービスとして提供する場合に、提供側が設定するプロンプトを「マスタープロンプト」と呼び、ユーザー側が入力する指示を「ユーザープロンプト」という。マスタープロンプトでは「違法、非倫理的な質問には答えないようにして」など、チャットAIの挙動を指定する。このユーザープロンプトを調整して、チャットAIに提供側が意図していない動作をさせる攻撃のことを「プロンプトインジェクション」という。現在よく使われるプロンプトインジェクション攻撃としては「プロンプトリーク」「ジェイルブレイク」などがあるという。
2023/8/10 ヤプリが新事業 ノーコード・CRMに次ぐ3本目の柱に
ノーコードのアプリ開発プラットフォームを提供するヤプリが、HRテック領域に参入する。これまで同社のプラットフォームは、小売や流通などの業種で、ポイントカードアプリやEコマースなど顧客との関係構築向けに使われてきた。一方、8月9日に発表した新サービスでは対象を社員に変更。組織と社員の関係「組織エンゲージメント」を強化するための機能を提供するという。
2023/8/10 出産後にうつ病の症状を発症する「産後うつ病」を治療するための飲み薬をFDAが認可
出産に伴って女性の体内でホルモンバランスが崩れることで、出産後に数週間から数カ月にわたって心理的障害が発生する「産後うつ病」の症状を緩和するための経口薬「ズラノロン」が**アメリカ食品医薬品局**(FDA)に2023年8月4日、産後うつ病に対する経口薬として初めて認可されました。
2023/8/10 Googleが「Project IDX」発表。生成的AIが支援するマルチプラットフォーム、フルスタックアプリ開発対応のWebIDE
Googleは、Webブラウザベースの新しい統合開発環境「Project IDX」を発表しました。Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。
2023/8/9 医療AIの性能を検証する大規模プロジェクト、MITやハーバード、マイクロソフトなど始動
「医療AIの性能を大規模で多様な患者集団で検証」する国際的プロジェクトを、MIT、ハーバード、スタンフォード、マイクロソフトなどの機関が共同で開始しました。医療AIが急速に開発されている一方で、その評価は十分に行われていません。そこで、このプロジェクトでは、医療AIの性能を広範で定量的に評価する新たなプラットフォームMedPerfを開発しました。このプラットフォームでは、参加する各医療施設に医療AIモデルが安全に配布され、それぞれの施設の独自のデータを用いてモデルが評価されます。
2023/8/9 作って遊ぼう!LLMを搭載した君だけのV&Lモデル!
今回の記事は2023年7月に開催されたABCI LLMハッカソンで取り組んだときに開発していたGIT-LLMというモデルの開発について解説する記事となっています。途中のコードの解説部分などは少し退屈に感じるかもしれませんので、その場合はぜひ結果のパートだけでも見てみてください。いろいろ実験や解析をしましたので、こんなことができるのかと楽しんでもらえるかと思います。
2022/3/4 因果推論の先へ―機械学習で因果効果を予測する『反実仮想機械学習(Counterfactual Machine Learning)』入門
ARISE analytics の近藤です。本記事では、次世代の意思決定技術として注目されている反実仮想機械学習(Counterfactual Machine Learning:CFML)を紹介します。本記事は、CFMLを日本語で体系的に整理し、初学者の理解を手助けすることをねらいとして執筆しました。本記事の理解促進につながるように、ベースとなった勉強会資料を記載します。こちらも併せて閲覧いただくことで理解の助けになれば幸いです。
2023/8/9のピックアップ
2023/8/9 Googleが策定を進めるウェブ標準「Web Environment Integrity」に電子フロンティア財団が「ユーザーの自律性を損なう」との異議を唱える
Googleは、OSやその他のソフトウェアに関する改ざん防止情報を送信し、それをウェブサイトと共有するコードをChromeに追加することで、広告詐欺の件数が減少すると主張していますが、実際には一部のウェブサイトが「承認されていない」OSやブラウザを使用しているユーザーからのアクセスをブロックする可能性があることが懸念されています。また、新しいブラウザの参入障壁が高くなることも指摘されています。
2023/8/9 LazyPredictで一気に分類・回帰モデルの精度を検証する
機械学習をする際に便利なLazyPredictを導入してみました。SKLearn・LightGBMモデルの精度・評価指標とテストデータの予測値を一挙に検討できるので非常に便利です。自分用に分類予測用・回帰予測用のコードをメモしておきます。
2023/8/9 Intel製CPUに情報漏えいの恐れがある脆弱性「Downfall」が発見される、データやパスワードなどの機密情報が抜き取られる危険性
Intelは2023年8月8日に、同社が2015年から2020年に販売したCPUに新たな脆弱(ぜいじゃく)性が見つかったことを報告しました。「Downfall」と呼ばれるこの脆弱性は、攻撃者に悪用されるとデータや機密情報が抜き取られる恐れがあるとされています。
2023/8/9 Stability AIがオープンソースのコーディング補助AI「StableCode」を発表
StableCodeは「StableCode-Completion-Alpha-3B-4K」「StableCode-Instruct-Alpha-3B」「StableCode-Completion-Alpha-3B」という3種のモデルに分かれて公開されています。各モデルの概要は以下の通り。◆StableCode-Completion-Alpha-3B-4K StableCode-Completion-Alpha-3B-4Kは3種のモデルのベースモデルで、コーディング向け大規模言語モデルの開発支援プロジェクト「BigCode」が収集したデータセット「The Stack」のバージョン1.2を用いてトレーニングされています。学習データにはPythonやGo、Java、Javascript、C言語など多様なプログラミング言語が含まれています。◆StableCode-Instruct-Alpha-3B StableCode-Instruct-Alpha-3BはベースモデルであるStableCode-Completion-Alpha-3B-4Kをファインチューニングしたモデルで、指示に従ってコードを生成することができます。◆StableCode-Completion-Alpha-3BStableCode-Completion-Alpha-3Bはコードのオートコンプリート(補完)に特化したモデルで、最大1万6000トークンのコードを処理可能です。StableCode-Completion-Alpha-3Bでは既存のオープンソースコーディング補助AIの2~4倍のコードを処理可能とのこと。
2023/8/9 NVIDIA、生成AIモデルをPCやワークステーションで構築するための「AI Workbench」を近日リリース
米NVIDIAは8月8日(現地時間)、生成AIモデル構築のための新たな統合ツールキット「AI Workbench」を発表した。生成AIモデルをPCやワークステーション上で構築、テスト、カスタマイズできるように設計されている。必要であればそれをデータセンターやクラウドに拡張可能だ。
2023/8/9 NVIDIA、生成AI向け“スーパーチップ”「GH200 Grace Hopper」を2024年に発売
米NVIDIAのジェンセン・ファンCEOは8月8日(現地時間)、SIGGRAPH 2023の基調講演で、次世代“スーパーチップ”「GH200 Grace Hopper」を発表した。LLM(大規模言語モデル)などの複雑な生成AIワークロード向けに開発されており、幅広い構成で利用可能になるとしている。
2023/8/9 AIの知能が急激に低下してしまう「ドリフト」問題はなぜ発生するのか?
研究チームによって示された、AIの知能低下は「ドリフト」と呼ばれています。スタンフォード大学とカリフォルニア大学バークレー校の研究者によると、「AIにおけるドリフト問題は、非常に複雑なAIモデルの一部を改善しようとすると、モデルの他の部分のパフォーマンスが低下する問題」とのこと。スタンフォード大学でコンピューターサイエンスの研究を行うジェームズ・ゾウ氏は「AIモデルを微調整して特定の方向に強化すると、別の領域では後退してしまうリスクがあります」と述べ、「一貫してAIモデルを改善させ続けることは非常に困難です」と語っています。
2023/8/8のピックアップ
きょうは世界猫の日ですね!うちの猫たちにちゅーるをあげました。
ピックアップを書くのに毎日30分以上かかっているので、各記事への感想は書いたり書かなかったりにしようかなと思います。10分くらいで書き上げるようにしたい。
2023/8/8 カーネギーメロン大など、大規模言語モデルの脆弱性を突く攻撃手法が存在することを指摘
カーネギーメロン大などの研究者らは、大規模言語モデルの解釈を意図的に狂わせる手法を発見し、手法の詳細を公開しました。 こうした攻撃手法が明らかにされる意義は、AIの脆弱性を共有し、より強固で安全なモデルの開発を推進するためです。
この攻撃は、敵対的なサフィックスを生成することにより行われます。具体的には、あるモデルの応答が攻撃者の意図するものになるような、クエリの終わりに追加するサフィックスを見つけ出します。これにより、モデルが問題のある内容を生成する可能性が最大化されます。
2023/8/8 OpenAIが将来のAIモデルの改善に向けたウェブクローラー「GPTBot」を発表、同時にAIによる無断での学習を防ぐためのブロック方法も公開
OpenAIは、2023年8月に自社のAI製品の学習に使用されるウェブクローラー「GPTBot」を公開しました。GPTBotによる学習で、AIモデルの精度向上や一般的な能力、安全性の改善に役立つ可能性が示唆されています。一方で、今後登場するOpenAIのAI関連製品に自身のサイトのコンテンツを無断で使用されたくないと考えるユーザーもいるはず。そこでOpenAIはGPTBotによるクローリングをブロックするための方法を紹介しています。
2023/8/8 テキストを古活字(くずし字)に変換できる「そあん(soan)」が登場したので現代の文章を趣深い見た目に変換してみた
現代の日本で利用されている日本語のテキストを、16世紀末から17世紀初めという非常に短い期間に日本で刊行された**古活字版で使用された古活字(くずし字)に変換することができる「そあん(soan)」をROIS-DS人文学オープンデータ共同利用センター**が公開しました。そあんではテキストを古活字に変換した画像を生成してくれるということで、さっそく使ってみました。
2023/8/8 最近の話題にも詳しい14億パラメータの日本語LLMの公開
今回、ストックマークは最近の話題にも詳しいGPT-NeoXをベースとした14億パラメータの日本語のLLM(大規模言語モデル)をオープンソースとして公開します。モデルはHugging Face Hubからダウンロードいただけます。当社はビジネスにおける情報収集・分析をサポートするサービスを運営しており、そのために最新のWebデータの収集を日々行なっております。今回の事前学習では、一般にLLMの事前学習によく使われるCommon Crawl由来のデータだけでなく、当社が所有している独自のWebデータ(2023年6月まで)も含めて事前学習を行うことで、最近の話題にも詳しいモデルを開発しました。具体的には、事前学習に用いたデータセットはCC100の日本語サブセット、Wikipediaの日本語版、当社独自の日本語Webデータから構成されています。コーパス全体でのデータ量は約200億トークンで、そのうち当社独自のWebデータは約90億トークンほどです。モデルのアーキテクチャの詳細などは以下をご覧ください。**https://huggingface.co/stockmark/gpt-neox-japanese-1.4b/blob/main/config.json**
2023/8/8 わからないことを恐れず、わからない自分を大切に。本屋のバイトからプログラマーになった私が本を書く理由
この記事では、コンピューターのことを何も知らなかったわたしが、子ども・初学者向けにプログラミングの本を出版するに至った経験についてお話をしていこうと思います。これからのキャリアを考える若手プログラマーのひとつの参考に、という記事になります。
2023/8/8 GitHub Copilot、開発中のコードがパブリックリポジトリのコードと150文字程度一致したら教えてくれる「code referencing」機能を追加
コードと開発中のコードがパブリックリポジトリ上の150文字程度のコードとの一致が発見されると、上記画面のように一致した部分のコード、一致したコードが存在するパブリックリポジトリ、そしてパブリックリポジトリのライセンスが表示されます。 複数のリポジトリがあれば、上記の情報がそれぞれのリポジトリごとに表示されます。 こうしてコードの一致が発見され、その情報が表示されたあと、それをどのように活かすかはプログラマに委ねられています。
2023/8/7のピックアップ
2023/8/7 視覚から言語を理解して未来を予測する次世代のAI「Dynalang」
「言語を用いて未来を予測する」というDynalangの主要な考え方は、自然言語処理や機械学習の領域で以前から試みられてきたとも言えます。Dynalangの特筆すべき革新的な側面は、視覚的状況と言語の間の関連性を具現化することにあります。Dynalangは、この二つの異なる情報源を統合し、未来を予測するための基盤として使用します。従来の手法は、視覚的な情報と言語情報を個別に処理する傾向がありましたが、Dynalangはこれらを統合することで一段階進んだアプローチを提供します。
ちょっと難しかったのであまり理解していないのですが、視覚情報と言語処理ができたら人間に近いのでは…?もちろんまだ複雑な問題は処理できないのだと思いますが、すごい勢いで技術が進んでいきますね。
2023/8/7 クラスメソッド データアナリティクス通信(機械学習編) – 2023年8月号
AWSではSageMaker Canvasのアップデートが多数ありました。特にQuickSightやTextractなどほかのサービスとの統合が追加されていました。SageMaker Canvasを使えばUIから機械学習モデルの構築と利用ができます。今後もどんどんと、SageMaker Canvasを中心にノーコードで様々な機械学習サービスの利用や連携をすることができるようになるかもしれないですね。
AWSの機械学習まわりの機能アップデートに関するまとめです。さすがクラスメソッド、AWSに強い。いまはAWSの機械学習のサービスを使っていませんが、将来使うことになるかも。近いうちに「認定機械学習」の資格を取りたいと思っています。
2023/8/7 Zoom中にマイクが拾ったキーボードの音から93%の精度で入力内容を推測可能、スマホならなんと95%との研究結果
スマートフォンに内蔵されたマイクで録音したMacBook Proのキーボードの音から、95%もの精度で入力内容を盗み出すことができたと、イギリスの研究チームが発表しました。ビデオ会議を録音した内容からでも93%の割合でデータを再現できたことから、機械学習の進歩により音を使ってパスワードや重要なデータを盗む技術「音響**サイドチャネル攻撃**(Acoustic Side Channel Attack)」が、従来より格段に危険性を増していることが指摘されています。
これはなかなか脅威ですね…
根本的な防御策として、ビデオ会議中には重要な情報をタイピングせず、やむを得ない場合は入力中にマイクをミュートにすることが提唱されています。さらに、指紋などの生体認証やパスワードマネージャーの使用によりパスワード入力そのものを回避するのも効果的とのこと。
2023/8/7 大規模言語モデルの「検閲」を解除した無修正モデルが作成されている、その利点とは?
ChatGPTを始め、多くの大規模言語モデルは「有害」な回答をしないように調整が行われており、例えば薬物や爆弾などの作り方を聞いても答えてくれないようになっています。こうした検閲が行われることは一般向けのチャットAIとしては良いことであるものの、デメリットも大きいとして一部の人々が検閲を解除した無修正モデルを作成しています。
無修正モデルの作者の1人であるエリック・ハートフォードさんは無修正モデルが必要な理由として以下の4点を挙げています。1:どの文化の規範に従うかの選択肢が必要 2:創作分野で活用できる 3:大規模言語モデルを真に所有できる 4:コンポーザビリティ(構成可能性)
『大規模言語モデルは新たな知能か?』(書評はこちらhttps://datascience-beginner.mofumofu.page/?p=147)でも、AIにどのような倫理観を持たせるかは人間の都合であり、人間の側で議論する必要があると問題提起されていました。上のリンクでハートフォードさんがあげている論点は、「確かに」という感じで、いまのChatGPTは「OpenAIが考える正しさ」しか反映していないのですね。一般公開されるチャットAIはもちろん何らかの修正が必要ではありますが(チャットAIを通じて差別や偏見が助長…というか爆発的に広まってしまう懸念がある)、そのベースとなるLLMは無修正のものが良い、というのはその通りだなと思いました。詳細はリンクをご覧ください。
2023/8/7 生成AIによる著作権問題、日本弁理士会が論点整理
生成系AIが生成するイラストや文章などについて著作権上の課題が指摘されるなか、日本弁理士会は2023年8月4日、報道関係者を対象に「生成系AIと著作権法における論点整理」のための説明会を開催した。この問題について弁理士の立場からの見方を示すとともに、生成系AIの技術についても触れ、AI利用装置やAI利用発明に関する特許や発明などについても説明を行った。
AIでイラストや文章などを生成した場合に、その生成物には著作権があるのか?という問題があります。日本弁理士会(特許や知財に関するプロ)が論点を整理する説明会を開催したということです。要点がまとまっていたので、引用します。
生成AIの活用について、高橋弁理士はいくつかの提案と対策を提示した。ひとつめは、著作権ビジネスを想定している場合には「著作権が生じるように創作すること」が重要だということだ。「著作権がなければ他者が複製できてしまうため、著作権の存在を前提としたビジネスが成立しなくなる。何を目的として、どのAIを使って、誰がどのように創作するか、という戦略と過程が重要になる。創作過程の証拠確保にはタイムスタンプなどの活用も考えられる」(高橋氏)2つめは、AIによる生成物を開示した際に発生する課題への対応である。生成物を開示する際には、それが他人の著作権を侵害していないかを検討しなくてはならないとする。ここでも、紛争時を想定して、創作過程の詳細を記録しておくことが重要だと述べた。「300行ものプロンプトを打ち込んで生成した絵だとしても、その証明がなければ裁判では不利になる。紛争を想定すると、生成AIを活用した生成物には、創作過程を記録することは『義務』に近い話になる可能性がある」(高橋氏)
2023/8/7 採用活動のためにpaizaのプログラミングスキルチェックをやってみたので概要と感想を書きます
採用活動をしているとエンジニア向けの転職・就職・学習プラットフォームであるpaizaのプログラミングスキルチェックについてもよく見かけます。ということで、めちゃくちゃ有名なサービスのため今更感が半端ありませんが、今回はpaizaのプログラミングスキルチェックについて「どのような流れで進むのか」「実際にやってみた感想」を記事にします。
SからDの等級のついたプログラミング問題を解くことで、プログラミングスキルをランクづけできるサービスです。転職でも有利になるみたい。制限時間ありで、同じ問題は一度しか評価判定対象にならないようです。転職を考えているわけではありませんが、自分のスキルがどれくらいなのか気になるので、挑戦してみたい。
2023/8/7 顕微鏡画像向け、リアルタイム物体検出AIシステム 病理画像の自動解析に活用
カナダのウォータールー大学や米ミシガン大学などに所属する研究者らが発表した論文「An Investigation into Glomeruli Detection in Kidney H&E and PAS Images using YOLO」は、顕微鏡画像用のリアルタイム物体検出システムを提案した研究報告である。(中略)公開データセットでYOLO-v4をトレーニングし、ミシガン大学のPAS染色画像7枚のみで微調整を行った結果、ミシガン大学のPAS染色画像20枚でネットワークを検証しながら、平均感度85%、平均特異度89%を達成し、これは異なるトレーニングデータセットの中で最高の結果であった。H&E染色画像での評価では、両データセットでの学習により平均感度70%、平均特異度96%が得られた。
YOLOは画像にバウンディングボックス(物体の位置を四角い箱で囲ってラベル付けする)を出力できるので、特定の病理パターンの発見ができると結果が見やすくて良さそうですね。
2023/8/7 SMSを送って相手の位置を特定するサイバー攻撃 スマホ持つ全ユーザーに到達可能 米研究者らが開発
米ノースイースタン大学などに所属する研究者らが発表した論文「Freaky Leaky SMS: Extracting User Locations by Analyzing SMS Timings」は、SMS(Short Message Service)を送ることで相手のスマートフォンの位置を特定するサイドチャネル攻撃を提案した研究報告である。攻撃者は、ユーザーのスマートフォンに複数のテキストメッセージを送信する。ユーザーの自動配信の返信のタイミングによって、ユーザーの位置を三角測量で特定できる。攻撃は、SMSの送信者がネットワークを介してSMSを送った後に、送信者に送り返されるSMSデリバリーレポートを利用して行われる。送信者はこれらのレポートを要求でき、受信者がそれを防ぐ方法はない。
コードがGitHubで公開される予定になっていますが、これ、大丈夫なんだろうか…避けようがない攻撃みたいなので恐ろしいです。
2023/8/7 AIと一緒に話す時代!マルチユーザー✖️マルチAIのチャットを作ってみた
最近ChatGPTを使っていて「コレ、他の人も参加してもらってブレストとかできたら面白いな。。」と思ったので、AI参加型のマルチチャット – BrAInsを作ってみました。複数人が同時に参加でき、複数のAIを参加させることができます。
複数のAIでコミュニケーションをとる、というのはアイデアがおもしろいですね。Streamlitを使っていらっしゃるようですが、こんなこともできるのか…実装も参考になりそう。
2023/8/7 Threads、Webからの利用と検索に対応 数週間以内に
Threadsについては、アクティブユーザー減も伝えられているが、ザッカーバーグ氏は4日、「スレッドにとって良い週だった。コミュニティは、活気のある長期的なアプリを構築するために軌道に乗っている。数週間後には検索とウェブが登場する」と言及。現在のThreadsは、アプリでしか投稿できず、Webからは投稿できない(閲覧は可能)が、PCなどのWebからも利用可能とする。
Twitter (X)の運営がなんだかきな臭くなってきて、なにかあったときのための避難場所を探しています。Twitterでしか繋がっていないお友達もいるので、もしもTwitterがなくなったとしてもつながれるようにしたいなあと思っています。いまのところThreadsが代替サービスとして有力候補なのですが、検索機能がつくとさらに期待できそう。
2023/8/6のピックアップ
2023/7/30 つくりながら学ぶ!AIアプリ開発入門 – LangChain & Streamlit による ChatGPT API 徹底活用
この本では、LangChain と Streamlit を用いて、ChatGPT APIを活用するAIアプリを開発していきます。つくりながら学ぶことを重視し、簡単なチャットアプリ開発から始めて、Embeddingを活用するアプリ開発まで、ステップバイステップで学べます。AIアプリをローカル環境で開発した後は、WEB上にデプロイする方法も学びます。クラウドの知識もほぼ必要なく、ランニングコストも掛からない方法で行うため、ぜひ作ったアプリを公開することにチャレンジしてみましょう。
おもしろそう!LangChainでなにかつくってみたかったので、これを参考にして触ってみよう。
2023/8/5のピックアップ
2023/8/5 LangChainでToolを作ってアニメランキングを表示させてみた
みなさんがよく使っているChatGPTで、あ~これネットの最新の情報取ってきたいんだよなぁみたいな事ありませんか?ChatGPTは、モデルが作られたときの情報しか持っていないので、最新の情報を取得できません。。。でも、ネットから情報を取ってきていい感じに表示してほしいんだけどみたいなこともあると思います。そこで今回は、「アニメランキング」の最新を取得する機能(Tool)を作って解説してみたいと思います。
ChatGPTのLangChainでToolを作って、dアニメのAPIを叩いてアニメランキングのデータを取得しています。LangChainはまだ触ったことがないのですが(従量課金制がこわくて…)、こうやって簡単にAPIたたく指示を出せるのはとっても便利そう。やってみるか…!
Toolsについては下記の記事がわかりやすかったです。
2023/5/12 【LangChainと外部APIの連携】 Agents×Tools完全攻略 (v0.0.165)
(Agent機能は)ユーザが指示したことを達成するために「思考→行動→観察」を行ってくれる機能です。まさにReasoning and Actですね。「行動」はLangChain側で用意されているものに加え、ユーザでカスタマイズすることもできます。Toolsと呼ばれています。
こちらの記事(Zennで書かれた書籍)はLangChain全般についてよくまとまっています。
2023/7/22 サクッと始めるプロンプトエンジニアリング【LangChain / ChatGPT】
2023/8/5 「食べる時間」を制限するダイエットはカロリー制限とほぼ同じ減量効果があることが判明
イリノイ大学シカゴ校の研究者らは、人気が高まりつつある食事法である「Time-Restricted Eating(食事時間制限)」の長期的な有効性を評価するため、18~65歳の肥満の成人90人を集めて1年間の実験を行いました。実験の参加者は、カロリー計算をしない代わりに食事ができる時間を12時から20時までの8時間に限定する「食事時間制限グループ」、食事内容を細かくチェックして1日の摂取カロリーを25%抑制する「カロリー制限グループ」、それまで通りの食事を続ける「対照グループ」の3グループに無作為に分けられ、6カ月間決められた食生活を続けました。その結果、どちらの制限グループも体重が約5%減りました。
食事をする時間を限定するだけでダイエットできるなら明日からでもやります!
朝はしっかり、夜は軽めがいいというのは結構聞く話ですよね。とはいえ、定時までお仕事してから食事をするとどうしても遅くなりがち…軽くおにぎりひとつで済ませるとかそういう戦略がいいのかもしれません。
2023/8/5 “授業中の居眠りをAIで検出” 大阪教育大がシステム開発
研究グループでは、複数の人の体温を同時に測定できる「サーマルカメラ」で教室の様子を撮影し、授業中に学生がどんな姿勢をとっているかAI=人工知能を使って解析するシステムを開発しました。そして、教室で実証実験を行ったところ、▼席に座る、▼立ち上がる、▼居眠りするときのように机に上半身を伏せる、という3つの姿勢について、それぞれ90%以上の精度で見分けることができたということです。
こういう監視みたいなのちょっとどうなの?と思ったのですが、授業の内容の改善に役立てるのが目的のようです。たしかに、多くの生徒が居眠りをしている授業は改善の余地がありそう。しかしサーマルカメラなので顔が判別できないからプライバシーに配慮できるということですが、座っている座席でだいたい誰なのかわかってしまいますし、これは当初の目的以外の使い方がされてしまいそうで、あんまりよくない気がします。そもそも、居眠りをする原因も色々で、単純に授業がつまらないからというのが理由というわけではないと思うし。
2023/8/2 若者の早期退職をAIが分析 名大大学院などが研究
若者の早期退職が企業の悩みとなる中、名古屋大学の研究室などが企業の採用試験で行う適性検査の回答データをAIを使って分析することで入社3年未満で退職する若者を採用前の段階で予測することに成功したと発表しました。
これは難しい問題ですね。これまで人が分析して判断していたところをAIに置き換えただけだという見方もできるかもしれない。しかし人間の判断ではいろいろ総合的に判断できていたかもしれないところ、AIで一部の情報でジャッジするようになるのは人権侵害という気がします。じゃあ採用周りを全部AIに任せるのか?というとそれもまた大きな問題がありそう。
以前リクナビのAI活用でも問題がありましたね。
こちらの記事に問題点がよくまとまっていました。
2019/10/8 アマゾンも止めたAI採用。リクナビ問題に潜むAI活用のリスク
人事労務分野での今後のAIの活用について前出の髙橋氏(注:株式会社モザイクワークの髙橋実取締役COO)はこう危惧する。
「現在のAI技術で可能なのは人間が見落としているものを把握すること、もう一つが大量の認識データを分析し、その結果に基づいて予測できること。課題を解決する魔法ではなく、そのために必要な要件をどのように定義するかを考える必要がある。しかし、AIを使う最大の障害は、人事部が人事の仕事を論理的に整理できていないこと、もう一つがデータを取り扱う人事担当者が倫理観を含めて必要な要件を定義できない、つまり論理的に考えるスキルが不足していることだ。ネガティブな方向で活用した内定辞退率予測が批判されたのは、まさにその点が欠けているからだ」
AIは決して万能ではない。その活用方法を間違うと、働く人にとって不幸をもたらす可能性もある。
2023/8/5 リアルタイムでボイチェンできる「CoeFont Voice Changer」
株式会社CoeFontは、リアルタイムで自身の声を変換できる「CoeFont Voice Changer」のβ版を提供開始した。CoeFont Voice Changerは、発話者の声をリアルタイムで変換できるツール。動画や音声の配信のほか、Web会議などでの活用も想定している。β版はWindows向けのデスクトップアプリとして提供しており、CoeFontのオリジナルキャラクター「アリアル」、「ミリアル」、「アベルーニ」の3種類の音声を無料で利用できる。macOS版については順次対応を予定している。
おもしろそうですね!動画配信されるかたも増えてきましたし、自分の声を出したくない方には需要がありそう。
2023/8/5 LLMを利用したRAG(Retrieval Augmented Generation)と著作権侵害
近時、LLMを利用し、社内外の文書データを用いた精度の高いチャットボットを構築するために、RAG(Retrieval Augmented Generation)という手法が注目されています。LLMをそのまま利用してチャットボットの構築を行うと、通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができないか、あるいは正しくない回答を返してしまいます。この問題を解決する手法として注目されているのがRAGです。この手法は、あらかじめ社内外の文書データをデータベース(DB)として準備しておき、ユーザからの質問がなされた場合には、当該質問と関連性が高い文書データを検索し、その文章データを質問文に付加してLLMに入力することで、精度が高い、かつ実際の文書データに紐付いた回答を生成することができるというものです。(中略)今回は、このRAGと著作権法の問題について検討をします。
すでにあるドキュメントをもとにチャットボットを構築したいという需要は多そう。第三者の著作物を使う場合に著作権法に抵触するか?という話です。結論から言うと「基本的にはOK」ということですが、条件があるようです。法律の話は難しいけど重要なのでちゃんと読みます。
2023/8/4 Microsoft謹製エンタープライズ向けPrivate ChatGPT(Azure ChatGPT)が公開されたのでローカル環境で動かしてみた
自社内やローカルの環境で実行でき、社外秘の情報が流出することがないChatGPTということで、これは会社では需要がありそうです。現時点ではドキュメントが少なく、動かすまで大変なようですが、改善されると本家ChatGPTよりも利用する人が多くなるかもしれません。
ソースはこちら。https://github.com/microsoft/azurechatgpt
2015/8/16 デモ」や「花火」の参加人数ってどう数えるの?
先日花火大会に行ったのですが、「〇〇万人が訪れました」と報道されていて、どうやって観測しているのかな?と疑問に思い調べてみました。
その規制区域内に、墨田区では23か所の定点観測ポイントを設置し、職員を配置しています。例えば、個々の観測ポイントで、平均的に1平方メートルあたり何人いるかを確認し、その人数に面積を掛けて割り出します。それを、17時から20時30分まで同じ時間に合わせて定期的に行い、各観測ポイントごとの合計人数を算出し、23か所の数値を合計した数が、墨田区内の観客数となります。
ということで、観測ポイントで人が人数をカウントしていて、それをもとに計算して求めているようです。この記事は2015年ですが、今なら上空画像からAIで推定するとかできそうな気がしますね(すでにしているかもしれない)。
2023/8/4のピックアップ
2019/10/29 「初手LightGBM」をする7つの理由
初手としては、手の混んだ特徴量を作らずに、まずは何かしらの予測結果を生成したい場合も多いです。LightGBMは既存のデータセットを極力加工せずに利用するという観点で、特徴量エンジニアリングの負担を軽減してくれる特徴があります。理由1〜3は、これらの特徴によるものです。
1. 欠損値をそのまま扱える
2. カテゴリ変数の指定ができる
3. 特徴量のスケーリングが不要
atmaCup#15の初心者講座第一回
で紹介されていました。
atmaCupは日本のatma社 https://www.atma.co.jp/ が提供している分析コンペです。Discussionも盛んだし、参加されている方もすごく優秀な方が多くて、とても盛り上がっていました。わたしは参加登録はしたんですが、なかなかまとまった時間が取れずに分析に取り掛かれませんでした…いまからでもsubmitできるようなので、初心者講座や優秀成績者の方の解法を見て、手を動かしてみたいと思っています。
いまの業務がシステム開発寄りなので、分析スキルを上げる訓練をしないとな〜と思っており、それには分析コンペがいいだろうなと思ってはいるのですが、なかなか大変そうで他のタスクを優先してしまっています…よくない。もっと手を動かすことに時間を割かないといけないな。もっと本も読みたいし、ああ、時間が足りない…
2023/8/4 ChatGPTにプロンプト提案機能 有料版デフォルトはGPT-4に 次のアップデートで
2023/8/4 ChatGPT、デフォルトをGPT-4に 「返信の提案」などアップデート
・プロンプトの例:新しいチャットの開始時に、開始に役立つ例が表示される
・返信の提案: 会話を続けるための返信例をおすすめ デフォルトでGPT-4に: Plusユーザーが新しいチャットを開始すると、ChatGPTで以前に選択したモデルを記憶。デフォルトがGPT-3.5ではなくなる
・複数のファイルアップロード:ChatGPTに、データを分析し、複数のファイルにわたる考察の生成を依頼できるように。Plus ユーザーがCode Interpreterで利用可能に
・ログイン状態を維持:2週間ごとのログアウトを廃止 キーボード ショートカット: ⌘(Ctrl) + Shift + ; などのショートカット(最後のコードブロックをコピー)に対応
複数ファイルのアップロードはすごく便利ですね。ChatGPT自体はほぼ毎日使っていますが、Code Interpreterはまだ使いこなせていないのでもっと触りたい。
2023/8/4 ソフトバンク、生成AI開発の完全子会社「SB Intuitions」稼働へ
ソフトバンクは8月4日、AIの研究開発などを担う新子会社「SB Intuitions(エスビーインテュイッションズ)」(東京都港区)の活動を始めると発表した。日本語に特化した国産大規模言語モデル(LLM)の研究開発や生成AIサービスの開発、販売、提供などの事業を手掛ける。
これ、どうなんだろうなあ…国産の、日本語に特化したLLMがあるとやっぱりいいのだろうか。いまのChatGPTを見ていると、人間よりもきれいな日本語なんじゃないかってくらいの文章が返ってくるので、翻訳でいいんじゃないかと思ってしまうのだけど。ソフトバンクとはいえ子会社の財力でLLMを学習するだけのリソースを準備できるのだろうか。
2023/8/3のピックアップ
2023/8/3 超伝導とは何なのか?そして常温常圧で超伝導を実現するという「LK-99」とは何なのか&再現実験の結果まとめ
2023/8/3 LK-99は本当に常温常圧超伝導を達成しているのか
夢の常温常圧超伝導が実現するかも?データサイエンス界隈でも話題になっています。上記の2記事は、超伝導とはなにか?についても書かれていて、超伝導に詳しくない人も興味を持てそうでした。
わたしも昨日はちょっと興奮したのですが、きちんとした結果がでるまでは時間がかかるもの。合成が簡単な物質のようですが、高純度で構造のそろったサンプルをつくるにはそれなりに試行錯誤が必要だと思います。また、測定も実験室レベルのものから大型測定装置が必要な場合もありますので、すぐには結論がでないでしょうね。それでももしかしたら…!というところで楽しみに待ちます。
2023/8/3 Google検索に生成系AIの回答を融合する実験 画像・動画も表示
米Googleは、検索サービスに生成系AIを応用する実験中のサービス「Search Generative Experience(SGE)」において、3つのアップデートを加えたと発表した。
まだ一般公開はされていないみたいですが、楽しみですね。GoogleはOpenAIにかなり出遅れているので、Google検索の優位性が無くなる前にこれで巻き返せるか。
2023/8/3 TwitterがXになったし、アプリアイコンだけでA~Zはそろう? 大人の自由研究やってみた
というわけで、スマートフォンのアプリアイコンでアルファベット26種全てそろうのか大人の自由研究として調べてみた。調査対象にしたのはApp Store上のアプリ。大文字A~Zのみを表示するアイコンを持つアプリを探してみた。
こういうの好き!
2023/8/3 NTTデータが生成AI使うシステム開発手法を全技術者に展開、人月型契約が見直しに
既に実証では開発工数を7割削減できたなど大きな成果事例が出ているという。システム構築の生産性が大幅に向上すると、受注できる案件を増やせる一方で、案件の単価や顧客単価が下がりかねない矛盾も抱える。システム構築の受注金額は、必要な工数を積算して算定根拠にする「人月型」の契約が主流だからだ。NTTデータは「課題を整理して、成果報酬型など顧客と新たな契約形態も検討を進める」(担当する技術革新統括本部システム技術本部ADM技部EGMグループの村上功修部長)ことで、生成AIがもたらすシステム構築事業へのインパクトに備える。
生産性が向上すると案件単価が下がる…うーんたしかにそれは問題だ。NTTデータは日本でも有数のIT企業(トップ企業と言ってもいいかも)なので、先陣を切って前例をつくっていってほしい。
2023/8/3 音を感じる新素材と、材料物性を音で操る方法を開発=東大など
東京大学とサンパウロ大学などの共同研究チームは、音を感じて力学物性が変化する新素材「感音性物質」の化学と高密度焦点式超音波(HIFU)の工学を融合し、架橋高分子材料内部の力学物性をピンポイントで操り、解体・再加工・再利用する新たな方法論を開発した。架橋高分子材料の解体および力学物性制御を「音」によって実現した。
どうやってつかうのかな?と思ったのですが、音(といってもHIFUという超音波)を当てることで高分子を遠隔的に解体できるということみたいで、これはいろいろ使い道がありそう。
2023/8/3 AIによる乳がん検診は発見率が20%上昇し放射線科医の仕事量を44%削減することにもつながる
早期発見・早期治療で救命できる可能性が高い**がんとされている乳がん**において、乳がん検診(乳がんスクリーニング)は早期発見の一番の近道です。この乳がんスクリーニングに人工知能(AI)を用いることで、乳がんの発見率が20%上昇し、さらに放射線科医の仕事量を約半分も減らすことができるという論文が発表されました。
こういう画像診断系のタスクは、似たような画像ばかりだし規格もそろっているはずで、AIは得意でしょうね。命に関わることなので、人間によるダブルチェックは絶対必要だと思いますが、効率化がはかれるのはいいことだと思います。
2023/8/3 Meta、テキストプロンプトで作曲できる生成AIスイート「AudioCraft」をオープンソース化
米Metaは8月2日(現地時間)、テキストプロンプトから音楽や音声を生成する生成AIツールスイート「AudioCraft」をオープンソース化したと発表した。トレーニングに使うデータの多様化もオープンソース化のねらいの1つだ。AudioCraftは、エフェクトやサウンドスケープを生成する「AudioGen」、テキストからメロディーを生成する「MusicGgen」、ニューラルネットワークベースのオーディオ圧縮コーデックの「EnCodec」の3つのコンポーネントで構成されている。MusicGenは単体で6月にオープンソース化されている。EnCodecは昨年11月に公開済みだが、最近の改良でより高品質な音楽生成が可能になったという。
ちょっとやってみたい。
利用のためには、
AudioCraftのインストールには、少なくとも16GBのメモリを備えるGPU、Python 3.9、PyTorch 2.0.0が必要。
ということなので、気軽に試せるものではなさそうですが。
2023/8/2のピックアップ
2023/8/2 常温常圧の「超電導」に関する論文の混乱と再現可能性について科学雑誌Scienceが再び解説
2023/8/2 夢の常温常圧超電導体「LK-99」の存在を支持する研究結果が相次いで発表される、再現したLK-99が超電導物質だと示唆する動画も公開
今日の一番注目のニュースはこれですね!実は学生時代、物性物理学(簡単にいうと、面白い性質をもった物質に着目して、便利な材料を作れないかな〜という分野)をやっていました。超伝導ではなくてマニアックな分野でしたが…常温常圧超伝導体が実現したら、エネルギー問題が急速に解決しそうで、これはすごいことです。とはいえ、まだ追試の段階なので落ち着いて進展を見守る必要があります。物理計算では超伝導体である可能性も示唆されているということなので、ワクワクしながら続報を待ちます!
2023/8/2 Scikit-learnのall_estimators()関数の活用:全モデルでの精度を一括比較する
all_estimators()
はScikit-learnが提供する全ての推定器(モデル)のリストを返す関数です。特に引数type_filter
を指定することで特定の種類(’classifier’、’regressor’等)のモデルだけを取得することが可能です。
一括して性能を評価できるみたいですね。便利そう!実行にどれくらい時間がかかるのかは書かれておらず、気になるところですが…
2023/8/2 「セミの羽」に触れた細菌が破壊される秘密がスパコンにより判明、抗菌作用だけでなく自己洗浄作用も発揮
夏の風物詩ともいえるセミの羽には、触れたバクテリアを殺してしまう強力な抗菌作用があります。アメリカのストーニーブルック大学とオークリッジ国立研究所の研究者らが、スーパーコンピューターを用いてセミの羽の微細構造の働きを明らかにし、細菌を破壊して自然に自己洗浄するメカニズムを突き止めたことを報告しました。
微細構造が細菌を殺す働きを持つらしいです…どういう仕組みなのかしら?ちょっと調べました。
2021/3/3 昆虫の羽の機能を再現した抗菌、防カビ、抗ウイルス機能表面の開発
昆虫は人間にはない独自の優れた生体機能を持っている事は良く知られていますが、近年、昆虫の羽は強い抗菌性を持つ事が分かってきました参考1。この抗菌性は、羽表面のナノ(ミリの100万分の1)サイズ微細突起による菌体への物理的なダメージに基づく効果であると言われており、これは簡単に言うと、小さな菌にとってトンボの羽表面のナノ構造は鋭い剱山のような物であり、その表面に触れる事で傷を負って死滅する、といったシンプルなメカニズムです。
なるほど、表面がトゲトゲしていて刺さって細菌が死ぬということのようです。上記のセミの構造では、破壊するだけでなく自己洗浄する構造になっていて優れているということでした。
2023/8/2 楽天とOpenAIが協業 最新APIを優先的に提供
楽天とOpenAIは、最新の対話型AI技術による新たな体験を提供するサービス開発における協業で基本合意した。消費者の購買体験を革新していくとともに、ビジネスパートナーの生産性向上に寄与することを目指す。
楽天の方からOpenAIに与えるメリットってなんなのでしょうか…あんまり将来の展開が予測できないですね。OpenAIとしても日本の大きな会社と取引したかったということでしょうかね。
2023/8/2 耳の穴に入れる、らせん状の脳波計測器 脳とコンピュータを接続 中国の研究者らが開発
この研究で提案する「SpiralE」という、らせん状のデバイスは、アタッチメントが不要であり、装着者の聴覚に影響を与えずに、スライドさせて簡単に装着や取り外しができる。SpiralEは電気熱作動下で適応的に拡張し、聴覚肉腔に沿ってらせんを描けるため、肉腔に過度な圧力をかけずに適切な接触を確保する。
これはおもしろそう!額に装着するタイプよりも精度が良さそうな気がします。
2023/8/2 AIが書いたテキストに“電子透かし”を入れる技術 人に見えない形式で埋め込み 米国チームが開発
電子透かしとは、テキスト中の隠れたパターンのことで、人間には知覚できないが、アルゴリズム的には合成テキストであることを識別可能にする。この研究では、合成テキストを短いトークン(25トークン程度)から検出可能にする効率的な電子透かしを提案する。
これはすごく大事な技術という気がします。AIが生成した画像・文章と、人間が生成したものは分けないとこれから問題がおきてくるのではないかな…
2023/8/2 大規模言語モデルに16,000以上のAPIを理解し適切に操作する能力を与える「ToolLLM」
APIの操作は、理解したAPIのドキュメンテーションに基づいて行われます。ToolLLMは、APIの呼び出し方を学習し、それを基にAPIを操作します。さらに、ToolLLMはAPIの操作を最適化することも可能です。これは、APIの呼び出し方を学習する過程で得られた知識を活用し、APIの操作をより効率的に行うための手法です。
うーんこういうの出てくると、本当に人間のエンジニアいらなくなってしまうのでは…とはいえドキュメントをきちんと書くことは必要になりそうです。
2023/8/1 のピックアップ
2023/8/1 ロボットが「初めて見る環境」で「初めて聞く指示」に対しても行動をとれるようにする
AI研究の最前線に立つDeepMindが新たな技術「RT-2」を開発しました。この技術は、ロボットが初めて見る環境で、初めて聞く指示に対しても適切な行動をとれるようにするものです。
ロボットには、現実世界の問題に対してどれが重要でどれから手をつけていいかわからない、といういわゆる「フレーム問題」がありました。それが解決しそうなのかしら?
というよりは、大規模言語モデルを使うことで指示が明確に出せるということなのかも。
RT-2の最大の特徴は、視覚と言語の情報を同時に処理する能力です。これにより、ロボットは視覚的な情報と言語的な指示を一度に理解し、それらを統合して適切な行動を生成することができます。
うーんロボット研究も急速に進歩しそうな予感。人間を特別たらしめていたのは言語能力だったのかもしれない。それが機械にあたえられるようになったら…
2023/7/31 大規模言語モデルが音声をダイレクトに理解する能力を与える Metaとケンブリッジ大
これまでの大規模言語モデルは基本的にテキストデータのみを扱うことが前提でした。Metaとケンブリッジ大学の研究者チームは、この限界を打破する新たな手法を提案しました。
これもロボットの開発に役立ちそうな技術。
2023/7/28 AIが生成したテキストが事実なのか確認する手法「FacTool」が登場
AIが情報を生成する能力は日々進化していますが、その一方で生成された情報の事実性を確認することは難しくなっています。そこで、この問題を解決するための新たなツールが開発されました。それが「FacTool」です。この記事では、FacToolの概要とその特徴、そしてどのように事実性を検証するのかについて詳しく解説します。
どのくらいの精度で判定できるのかなあ…
カーネギーメロン大、Meta AIなどの研究者の方が出している論文みたいなので、かなり信頼できそうではある。
2023/8/1 応用情報技術者試験を受けてみた
受験体験記を読むのが好き。やる気出る〜
2023/8/1 任天堂が次世代ゲーム機を2024年下半期にリリースする予定で主要開発者には開発キットが渡っていると報じられる、携帯モード・液晶画面・物理カードスロットあり
VGCは「任天堂の次世代ゲーム機プロジェクトに詳しい複数の関係者」から情報を得たとのこと。報道によると次世代ゲーム機の登場時期は2024年下半期で、PlayStation 5の発売後に発生したような極端な在庫不足を回避するために、在庫を十分に確保した状態で発売するとされています。加えて、主要な開発者はすでに開発機を入手しているとのこと。
Switchはスペックが限界…という話を聞くので、次世代機を出したいところでしょうね。とはいえSwitchはこれだけ普及しているからなあ。株主総会でも、次世代機を出すかSwitchを続けるのか話題になったみたいですね。
2023/8/1 ハンディファン、猛暑日は逆効果とメーカーが注意喚起 「濡れタオルとの併用を
理由について同社は、米国環境保護庁(EPA)が作成した猛暑対策ガイド「Excessive Heat Events Guidebook」の記述を挙げる。これは「熱指数温度(heat index)が華氏99°f(日本の基準に換算すると気温が35℃、湿度40%以上)を超えるときに携帯用扇風機だけを使用すると、皮膚表面に理想的な体温よりも暖かい空気を吹き付けることによって、身体が反応しなければならない熱ストレスが実際に増加する」という内容。ひいては熱中症の危険も増すという。
ではどうすれば良いのか。EPAはミストとの併用を、エレコムは濡らしたタオルやハンカチとの併用を勧めている。「この暑さはさすがに扇風機だけでは乗り切れません」(エレコム)。
うん、知ってた。クーラーの効いた部屋に移動したとき(電車の中とか飲食店とか)でガンガン体を冷やすのに使っていますがなかなか良いです。
コメント