2024年6月のテクノロジーニュースピックアップ！【2024/6/17更新】

2024/6/16のピックアップ
2024/6/15のピックアップ
2024/6/14のピックアップ
2024/6/13のピックアップ
2024/6/12のピックアップ
2024/6/11のピックアップ
2024/6/10のピックアップ
2024/6/9のピックアップ
2024/6/8のピックアップ
2024/6/7のピックアップ
2024/6/6のピックアップ
2024/6/5のピックアップ
2024/6/4のピックアップ
2024/6/3のピックアップ
2024/6/2のピックアップ
2024/6/1のピックアップ

2024/6/16のピックアップ

【開発技術】 2024-06-16 13:03:34 いまどきの分析設計パターン10選 https://speakerdeck.com/masuda220/jjug_ccc_2024_spring

——————————–

【開発技術】 2024-06-16 23:03:57 Don’t refactor the code https://dev.to/katafrakt/dont-refactor-the-code-igk

「コードをリファクタリングする」という言葉は本当に重要な作業を意味していますが、変数の名前を見た目の理由もなく変えるような、ほとんど怠けているようなことと区別がつかないのです。

そしてこれが、「コードをリファクタリングしない」という私の意味です：行ったこと、していること、またはする予定のことについて話すときは別の言葉を使いましょう。「リファクタリング」は使わないでください。

2024/6/15のピックアップ

【AIと人間の未来】 2024-06-15 19:17:00 “死者の演説”は認められる？選挙での生成AI利用どこまで | NHK https://www3.nhk.or.jp/news/html/20240615/k10014479761000.html

SNSに投稿された動画で、選挙での投票を呼びかけていたのはインドネシアのスハルト元大統領。2008年にすでに亡くなっている。生成AIを使って作られた動画で、いわば”復活”させられた形だ。いま、世界各地で、選挙でより多くの票を得ようと、生成AIを利用する動きが広がっている。何が、どこまで許されるのだろうか。日本の状況は。急速に変化する“AI選挙”を追った。

——————————–

【技術解説】 2024-06-15 20:51:00 Ubuntuの開発環境をコマンド一発で構築できる「Omakub」がRuby on Railsの作者によって公開される、Omakubは「おまかせUbuntu」の略 https://gigazine.net/news/20240615-omakase-ubuntu-omakub-dhh-linux/

Ruby on Railsの作者のデイヴィッド・ハイネマイヤーハンソン(通称、DHH)氏が、Ubuntuのウェブ開発環境をコマンド一発で構築できる「Omakub」をリリースしました。Omakubは「An Omakase Developer Setup for Ubuntu」の略称だそうです。

——————————–

【新しいLLM】 2024-06-15 22:15:00 NVIDIA Releases Open Synthetic Data Generation Pipeline for Training Large Language Models https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/

NVIDIA は、大規模言語モデル (LLM) の商用アプリケーション向けに合成データを生成するためのオープンモデル「Nemotron-4 340B」を発表しました。高品質なトレーニングデータは LLM の性能、精度、応答の質に重要な役割を果たしますが、ロバストなデータセットを入手するのは困難で高価な場合があります。Nemotron-4 340B は、開発者に無料でスケーラブルな方法を提供し、強力な LLM の構築を支援します。

Nemotron-4 340B ファミリーには、ベース、インストラクト、リワードの 3 つのモデルが含まれています。インストラクトモデルは、実世界のデータの特性を模倣する多様な合成データを生成し、LLM の性能とバスト性を高めます。リワードモデルは、生成されたテキストの質を 5 つの属性で評価し、高品質な応答を選別します。NVIDIA NeMo フレームワークを使ってこれらのモデルをファインチューニングし、NVIDIA TensorRT-LLM ライブラリを使って効率的な推論を行うことができます。

——————————–

【技術解説】 2024-06-15 22:38:30 perplexity.aiが速攻で$20払って良いと思えたくらいに情報収集を効率化してくれた件 – 理系学生日記 https://kiririmode.hatenablog.jp/entry/20240611/1718071295

Perplexity.aiは、生成AIを用いた検索エンジンと見なすことができるサービスで、情報収集の効率を劇的に向上さてくれます。ユーザーの質問に対してWebをクローリングし、関連情報を要約し、それらの参照リンクとともに高精度な回答を提供してくれる。

2024/6/14のピックアップ

【ニュース】 2024-06-14 09:25:00 OpenAI appoints Retired U.S. Army General Paul M. Nakasone to Board of Directors https://openai.com/index/openai-appoints-retired-us-army-general/

人工知能の発展に伴い、サイバーセキュリティの重要性が高まっています。OpenAIは、この課題に取り組むため、退役陸軍大将のポール M. ナカソネ氏を取締役会に迎えました。ナカソネ氏は、サイバーセキュリティの分野で豊富な経験を持つ専門家です。彼は、OpenAIの取締役会のセーフティーおよびセキュリティー委員会に参加し、AIを安全に開発・運用するための助言を行います。

——————————–

【新サービス】 2024-06-14 11:42:51 PDFを正確に要約してコピペ　アドビ「Acrobat AI アシスタント」日本語対応へ https://www.watch.impress.co.jp/docs/news/1600100.html

アドビは13日、Adobe Acrobatの生成AI機能「Acrobat AI Assistant」の日本語版を開発中と発表した。提供開始時期や価格は未定。

Acrobat AI Assistantは、Acrobat ReaderとAcrobatのワークフローに統合された、生成AIベースの対話型エンジン。複数または長文のPDFなどのドキュメントから、要約やインサイトを生成し、ユーザーからの質問の回答を通じて、メールやレポート、プレゼンテーションなどの用途に応じた文章を共有できる。

——————————–

【LLM新技術】 2024-06-14 13:00:00 Technique improves the reasoning capabilities of large language models https://news.mit.edu/2024/technique-improves-reasoning-capabilities-large-language-models-0614

MITの研究者らは、大規模言語モデルがプログラムを生成することで、自然言語、数学・データ分析、記号的推論のタスクを解決できるという新しい手法「自然言語埋め込みプログラム(NLEP)」を提案しました。NLEPでは、言語モデルにプログラムを作成・実行させ、その出力を自然言語で表示します。研究の結果、NLEPにより、大規模言語モデルの推論タスクの正確性が大幅に向上しました。また、NLEPはタスクに応じて再利用可能で、モデルの推論過程を可視化できるため、ユーザーが検証・修正できる点で透明性も高まります。

——————————–

【セキュリティ】 2024-06-14 13:00:56 委託先が私物HDD使用、データ削除せず廃棄　「プレミアムバンダイ」顧客情報漏えいの可能性 https://www.itmedia.co.jp/news/articles/2406/14/news130.html

通販サイト「プレミアムバンダイ」を運営するBANDAI SPIRITSは、業務委託先が保存していた会員の個人情報が漏えいした可能性があると6月11日に発表した。委託先社員が私物の外付けHDDを業務に利用し、データを削除せずに廃棄したため。このHDDを入手した人からの連絡で発覚した。ダークウェブなどのモニタリングを行っているが、個人情報が外部へ流出した事実は確認できず「データが外部へ漏えいした可能性は極めて低い」とみている。

——————————–

【新機能】 2024-06-14 14:56:49 Google、ChromeOSをAndroidベースに　AI機能拡充へ https://www.itmedia.co.jp/news/articles/2406/14/news148.html

米Googleは6月12日（現地時間）、「ChromeOSは間もなくAndroidスタックの大部分をベースに開発され、Google AI、イノベーション、機能をユーザーに迅速に提供できるようになる」と発表した。現在のChromeOSは独自のLinuxカーネルを使用しているが、今後はAndroidで使われているLinuxカーネルを採用することになる。これにより、ハードウェアとの互換性やデバイスドライバーの共有が容易になる。

——————————–

【セキュリティ】 2024-06-14 17:56:39 ニコニコを襲ったサイバー攻撃の全体像まとめ　動画データは無事か、復旧に1カ月かかる理由は https://www.itmedia.co.jp/news/articles/2406/14/news183.html

ドワンゴは6月14日、8日から続く大規模障害に関する詳細を発表した。原因はランサムウェアを含む大規模なサイバー攻撃。復旧には1カ月以上かかる見込みという。今回の発表に合わせ、KADOKAWA・ドワンゴの夏野剛社長、ドワンゴの栗田穣崇COO、鈴木圭一CTOによる状況説明の動画や、事態に関するQ＆Aも公開した。

——————————–

【技術解説】 2024-06-14 18:14:02 もうSoraは不要なのか。動画生成AIの新基準「Luma Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術（CloseBox） | テクノエッジ TechnoEdge https://www.techno-edge.net/article/2024/06/14/3468.html

——————————–

【ニュース】 2024-06-14 18:56:00 G7サミット、AIの倫理的使用に向けて議論　軍事利用など負の側面へ対応 https://www.itmedia.co.jp/news/articles/2406/14/news196.html

6月14日の先進7カ国首脳会議（G7サミット）では、AIの悪用防止へ向けた国際連携についても議論が行われる。自動で文章などを作成する生成AIは社会の成長に貢献すると期待されるものの、軍事利用や偽情報の拡散など負の側面も顕在化しており、G7として対応が急務だとの声が強まっている。会議にはAIの倫理面に懸念を持っているとされるローマ教皇フランシスコが参加。AIを倫理観に沿って使用するための国際的枠組みやガイドラインの創設へ向け協議したほか、AIが経済安全保障に影響を与えないよう規制する重要性などが確認される見通しだ。

2024/6/13のピックアップ

【LLMの評価】 2024-06-13 02:23:00 WildBench: Benchmarking LLMs with Challenging Tasks from Real Users in the Wild https://arxiv.org/abs/2406.04770

WildBenchは、大規模言語モデル(LLM)のベンチマークを行うために設計された自動評価フレームワークです。1,000万以上のヒューマン-チャットボット会話ログから慎重に選択された1,024個のタスクから構成されています。WildBenchの自動評価では、GPT-4-turboなどの高度なLLMを使用して計算可能な2つの指標、WB-RewardとWB-Scoreを開発しました。

WB-Rewardは、モデルの応答間の細かい対比較を行い、5つの可能な結果(大幅に優れている、わずかに優れている、わずかに劣っている、大幅に劣っている、または引き分け)を生成します。従来の評価とは異なり、WildBenchでは、包括的な対比較を行うために、異なるパフォーマンスレベルの3つのベースラインモデルを選択しました。また、応答の長さバイアスを軽減するために、勝者の応答がパララーの応答より K文字以上長い場合、「わずかに優れている/劣っている」の結果を「引き分け」に変換する簡単な方法を提案しました。

WB-Scoreは、モデルの出力の品質を個別に評価するため、迅速で費用効率的な評価指標です。WildBenchの結果は、Chatbot Arenaの人間が投票したEloレーティングとの強い相関を示しています。具体的には、WB-Rewardは上位モデルとの相関が0.98、WB-Scoreは長さ制御付きの勝率で0.95を達成し、ArenaHardの0.91やAlpacaEval2.0の0.89を上回っています。さらに、通常の勝率でも0.87を超えています。

——————————–

【技術解説】 2024-06-13 07:11:02 Apple Intelligence の機能 https://note.com/npaka/n/n658a9e0089c7

——————————–

【科学技術】 2024-06-13 08:00:00 “むにゅ”っとやわらかいタッチディスプレイ　指で押すとぷにぷにへこむ　英国チームが開発 https://www.itmedia.co.jp/news/articles/2406/13/news067.html

英バース大学に所属する研究者らが発表した論文「DeformIO: Dynamic Stiffness Control on a Deformable Force-Sensing Display」は、ユーザーの指の動きと指圧に応じて表面が柔軟に変形するソフトなタッチスクリーンを提案した研究報告である。「DeformIO」と呼ばれ、ユーザーがその表面を押したり触ったりすると、その場所の剛性を動的に柔らかく変化できる。

——————————–

【ニュース】 2024-06-13 12:48:00 OpenAI、AIインフラをAzureだけでなくOracle Cloudへも拡大へ https://www.itmedia.co.jp/news/articles/2406/13/news133.html

米Oracle、米Microsoft、米OpenAIの3社は提携を発表し、OpenAIにさらなるAIインフラのキャパシティを提供するために、OpenAIが利用するプラットフォームをMicrosoft Azureに加えてOracle Cloudへ拡大することを発表しました。

——————————–

【国内ニュース】 2024-06-13 15:11:18 LINE Payサービス終了に関するお知らせ https://line-pay-info.landpress.line.me/payment-info/

2025年4月30日（水）をもって日本国内におけるモバイル送金（送付）・決済サービス「LINE Pay」を終了いたします。

——————————–

【LLM】 2024-06-13 16:15:00 How Meta trains large language models at scale https://engineering.fb.com/2024/06/12/data-infrastructure/training-large-language-models-at-scale-meta/

高度な人工知能(AI)の研究開発において、最も重要な課題の1つは、大規模言語モデル(LLM)を学習するために膨大な計算リソースが必要になってきていることです。従来の人工知能モデルの学習には、比較的少数のGPUを使う方法が一般的でしたが、最近の生成型AIの発展により、少数の巨大なモデルの学習が必要になってきています。これにより、ソフトウェア、ハードウェア、ネットワークインフラストラクチャの統合的な見直しが求められています。

大規模なモデル学習の課題には、ハードウェアの信頼性、障害からの迅速な復旧、学習状態の効率的な保存、GPUs間の最適な接続が含まれます。これらの課題に対応するために、Meta社では、以下のような取り組みを行っています:

– PyTorchやその他の新しいオープンソースツールを活用し、研究から本番運用までの開発を高速化

– 動的なリソース割り当てアルゴリズムを用いたスケジューリング

– NVIDIA H100 GPUを使ったGrand Tetonプラットフォームの改良(TDP 700Wへの変更、HBM3への移行)

– データセンター内でのGPUラックの最適配置と冷却の見直し

– ハードウェア障害の検知と対処の自動化

また、ネットワークインフラストラクチャについても、RoCEとInfiniBandの2つのアプローチを試しながら最適化を進めています。通信パターンに応じたネットワークトポロジの活用や、集団通信アルゴリズムの最適化、ロードバランシングなどに取り組んでいます。さらに、大量のデータを効率的に保管・活用するためのストレージソリューションの開発にも力を入れています。

2024/6/12のピックアップ

【新技術】 2024-06-12 03:10:00 New algorithm discovers language just by watching videos https://news.mit.edu/2024/denseav-algorithm-discovers-language-just-watching-videos-0611

MIT博士課程学生のMark Hamiltonは、機械を使って動物のコミュニケーションを理解したいと考えています。その目的のために、「DenseAV」と呼ばれるシステムを開発しました。このシステムは、映像と音声の関係を学習することで、言語を「ゼロから」学習しようとするものです。具体的には、DenseAVは何百万もの動画に対して、その音声と映像の関係を照合することで、言語の意味を学習します。例えば、「ケーキをオーブンで350度で焼く」という音声を聞いた際に、ケーキやオーブンといった映像要素を見つけ出すことができます。このように、DenseAVは音声と映像の関係性を学習し、単語の意味を発見していきます。

興味深いことに、DenseAVは単語の意味だけでなく、単語と音声の違いも学習することができます。例えば、「犬」という単語と犬の吠え声の違いを理解することができるのです。これは、DenseAVが「二つの脳」を持っていることによるもので、一方は言語処理、もう一方は音声処理を担当しています。DenseAVの応用例としては、YouTubeなどの膨大な動画コンテンツから学習することや、文字記録のない動物のコミュニケーションの理解などが考えられます。特に後者については、DenseAVが新しい言語の発見に役立つ可能性があります。

DenseAVの開発にあたっては、言語モデルなどの事前学習された知識は一切使用せず、まさに「ゼロから」の言語学習を目指しました。そのために、音声と映像の情報を完全に分離し、対照学習によって言語の特徴を学習させる手法を採用しています。これにより、DenseAVは細かな詳細まで把握することができ、従来のモデルよりも優れた性能を発揮することができます。

——————————–

【セキュリティ】 2024-06-12 12:46:00 ランサム攻撃の被害相次ぐ、5月下旬から各所で　企業だけでなく自治体、病院にも影響 https://www.itmedia.co.jp/news/articles/2406/12/news123.html

例えば5月20日には、岡山県精神科医療センターが電子カルテなどに不具合が起きたと発表。後にランサムウェア攻撃が原因だったと明かした。6月11日には、患者情報約4万人分や、会議の議事録が漏えいした可能性があることも発表した。

5月29日には、システム機器の製造販売を手掛けるイセトー（京都市）が、ランサムウェア攻撃の被害を発表。追って、同社に事業を委託していた三井住友海上あいおい生命保険、神奈川県横須賀市、藤沢市、茅ケ崎市などが、イセトーに委託していた業務に関する情報漏えいの可能性を発表している。

6月3日には、九州電力グループで電気温水器の販売などを手掛けるキューヘン（福岡県福津市）が、第三者によるランサムウェア攻撃を受けたと発表。5日までに約10万4000件の個人情報が漏えいした可能性があることも分かった。

6月10日には、免震・制震装置を手掛けるオイレス工業（神奈川県藤沢市）や、ニデックグループのニデックインスツルメンツ（長野県諏訪郡）、税理士法人の高野総合会計事務所などからなる高野総合グループ（高ははしごだか）などがランサムウェア攻撃の被害を発表した。

——————————–

【ロボットとAI】 2024-06-12 13:00:00 Researchers use large language models to help robots navigate https://news.mit.edu/2024/researchers-use-large-language-models-to-help-robots-navigate-0612

この研究は、ロボットが言語に基づいて視覚情報を処理し、ユーザーの指示に沿って目的地まで移動する方法を提案しています。従来の手法では、画像の特徴量を直接使ってナビゲーションを行っていましたが、大量の視覚データが必要でした。一方、この研究では、ロボットの視点を表す言語キャプションを生成し、それを大規模言語モデルに入力することで、効率的にナビゲーション行動を学習できるというアプローチを取っています。

具体的には、まず簡単な画像キャプション生成モデルを使って、ロボットの視点を表す言語キャプションを生成します。次に、その言語キャプションと、ユーザーからの言語指示を大規模言語モデルに入力することで、次のナビゲーション行動を予測します。この行動の予測結果は、ロボットの移動履歴を更新するためにも使われます。

——————————–

【ニュース】 2024-06-12 14:00:00 Samsungが元Apple幹部を責任者とするAI特化の研究センターを新設 https://gigazine.net/news/20240612-samsung-ex-apple-executive-ai-center/

SamsungがAI研究に特化した北米の2つの研究センターを統合し、この新しいAI研究センターの責任者に元Appleの幹部を起用する予定であることが報道により明らかになりました。

——————————–

【AIと法律・規制】 2024-06-12 18:18:30 アップルやグーグルら大手IT規制　スマホソフト競争促進法が成立 https://www.watch.impress.co.jp/docs/news/1599609.html

スマートフォンのOSやアプリストアなどを手掛けるGoogleやAppleら、大手テクノロジー企業を規制する「スマホソフトウェア競争促進法」が、12日の参議院本会議において可決、成立した。

スマホソフトウェア競争促進法(スマートフォンにおいて利用される特定ソフトウェアに係る競争の促進に関する法律案)は、スマートフォンが国民生活や経済活動の基盤となっている中で、そのOSやアプリストア、ブラウザ、検索エンジンなどの「ソフトウェア」における市場競争環境の確保を狙うもの。

2024/6/11のピックアップ

【LLMの活用】 2024-06-11 03:37:00 What Do You See? Enhancing Zero-Shot Image Classification with Multimodal Large Language Models https://arxiv.org/abs/2405.15668

この研究論文は、マルチモーダルな大規模言語モデル(Large Language Model: LLM)を用いた画像分類の手法を提案しています。従来の手法とは異なり、この手法では人手によるプロンプト設計を必要としません。代わりに、単一の簡明なプロンプトセットを全てのデータセットに適用しています。

具体的な手順は以下の通りです。まず、入力画像からマルチモーダルなLLMを用いて詳細な textual representation を生成します。次に、これらの textual representation を cross-modal embedding space 上の固定長特徴量に変換します。最後に、これらの特徴量を線形分類器に入力することで、ゼロショット画像分類を実行します。

著者らは、この手法を複数のデータセットで評価しています。その結果、従来手法と比較して平均4.1%の精度向上を確認しました。特に ImageNet データセットでは6.8%の精度向上が得られています。この成果は、マルチモーダルなLLMがゼロショット画像分類などのコンピュータービジョンタスクを大幅に改善できる可能性を示しています。

——————————————-

【新サービス】 2024-06-11 04:00:11 アップル、AI本格展開　個人をアシストする「Apple Intelligence」 https://www.watch.impress.co.jp/docs/news/1598988.html

アップルは10日(米国時間)、新たなAI機能「Apple Intelligence」を発表した。iOSやiPadOS、macOSに組み込まれ、個人の文脈を理解した「パーソナルアシスタント」としてユーザーがやりたいことを支援する。今夏に英語環境でベータテストを開始する。開発者会議のWWDC 2024で発表されたが、日本語など他言語対応については言及していない。

iOS 18、iPadOS 18、macOS Sequoiaから搭載。ユーザーを理解して、やりたいことを支援するという機能で、メモ(Notes)で録音しながらサマリー(要約)を表示したり、文字起こししてくれるほか、メールの作成支援などに対応。基盤技術としてはOpenAIのGPT-4oを活用している。

——————————————-

【UI】 2024-06-11 06:00:00 Why Mesop? https://google.github.io/mesop/blog/2024/05/13/why-mesop/

メソップ(Mesop)は、Pythonデベロッパーが魅力的なWebアプリケーションを効率的に構築できるようにする新しいUIフレームワークです。多くのPythonのUIフレームワークは使い始めが簡単ですが、デフォルトを超えてカスタマイズする際には、JavaScriptやCSS、HTMLの知識が必要となり、多くのデベロッパーにとって学習曲線が急峻です。ところがメソップは、Pythonのみで柔軟なUIを構築することができ、学習コストを低く抑えることができます。

メソップは、コンポーネントベースの設計思想を採用しています。UIはいくつかの再利用可能な部品(コンポーネント)で構成されており、コンポーネントは単純なPythonの関数として実装されます。この方式には以下のような利点があります。- 簡単さ:既存のPythonの知識を活かしてUIを素早く直感的に構築できる – 保守性:複雑なUIをより小さな、焦点の合ったコンポーネントに分割できるため管理が容易になる – 柔軟性:コンポーネントが独立しているため、プロジェクト内や他のプロジェクトでの再利用が簡単

——————————————-

【ニュース】 2024-06-11 10:08:00 OpenAI welcomes Sarah Friar (CFO) and Kevin Weil (CPO) https://openai.com/index/openai-welcomes-cfo-cpo/

Chief Financial Officerとしてサラ・フリアーが加わります。彼女は、コア研究機能への継続的な投資を支え、急成長するお客様基盤や複雑グローバルな事業環境に対応できるよう、ファイナンス部門を率いていきます。サラ・フリアーは、最近まで Nextdoor の CEO を務めていました。以前は Square の CFO を務め、Goldman Sachs、McKinsey、Salesforce でも勤務しました。Walmart およびConsensysの取締役、Aspen Instituteのフェロー、Stanford Institute for Human-Centered AI(HAI)の Stanford Digital Economy Labの共同議長を務めています。

Chief Product Officerとしてケヴィン・ウェイルが加わります。彼は、研究成果をコンシューマー、開発者、企業のためのサービスに適用するプロダクトチームを率いていきます。ケヴィン・ウェイルは、最近まで Planet Labsのプレジデントを務めていました。以前は Libra暗号通貨の共同創設者、Facebook の Novi 製品担当VPおよびInstagram 、Twitterの製品担当SVPを務めていました。CFRの期限付き会員であり、The Nature Conservancyと Black Product Managers Networkの取締役を務めています。

——————————————-

【人間とAIの未来】 2024-06-11 12:38:30 Adobeが「ユーザーコンテンツをAI学習しない」と明記する形へ利用規約を再度全面見直し https://gigazine.net/news/20240611-adobe-tou-update/

2024年6月に更新されたAdobe Creative Cloudの利用規約にある「ユーザーコンテンツにAdobeがアクセスする可能性がある」という文言が大きく批判を浴びたことを受け、Adobeが利用規約の各項目について明確化することを約束しました。これにより、ユーザーが作成したコンテンツがAI学習に使用されないこと等が明記されます。

——————————————-

【新機能】 2024-06-11 14:42:16 iPadOS 18、ついに「計算機」搭載　ペン・手書きの「計算メモ」やAI活用 https://www.watch.impress.co.jp/docs/news/1599155.html

アップルは10日(米国時間)、WWDC2024において「iPadOS 18」を発表した。AI機能の「Apple Intelligence」に対応予定(英語)のほか、カスタマイズ機能や写真のアップデートなど多くの機能強化を図っている。

多くの機能はiOS 18と共通だが、iPadOSならではの特徴なるのが、Apple Pencil対応の強化や「計算機」アプリの追加となる。

——————————————-

【セキュリティ】 2024-06-11 15:55:25 VSCodeの偽拡張機能を作ったらダウンロードされまくり＆悪意あるコードを簡単に仕込めるVSCode拡張機能システムの欠陥も明らかになったという報告 https://gigazine.net/news/20240611-visual-studio-code-extension-risk/

Microsoft製テキストエディタ「Visual Studio Code(VSCode)」は拡張機能を導入することで機能を追加したり外観をカスタムしたりできます。セキュリティ研究者らが「人気拡張機能にコードを挿入した偽拡張機能」を公開した結果、短期間で大企業やセキュリティ企業を含む多くのユーザーのマシンにインストールされたとのこと。セキュリティ研究者らはVisual Studio Codeの拡張機能システムの欠陥を指摘し、警鐘を鳴らしています。

——————————————-

【新機能】 2024-06-11 16:00:25 「Google Meet」で共有した画面を直接操作可能に～「スライド」にはモード切り替え機能／「Google Workspace」6月2日週のアップデート情報 https://forest.watch.impress.co.jp/docs/news/1598861.html

米Googleは6月7日（現地時間）、「Google Workspace」6月7日週のアップデート情報を発表した。「Google Meet」で画面共有時の画面操作が改善されたほか、「Google スライド」にモード切り替え機能が追加された。

——————————————-

【セキュリティ】 2024-06-11 16:52:49 画像生成ソフトウェア「ComfyUI」のノードにキーロガーが仕込まれていたことが発覚、クレジットカード情報やパスワードなど全ての入力が筒抜けに https://gigazine.net/news/20240611-comfyui-llmvision-malware/

ノードベースの画像生成ソフトウェア「ComfyUI」向けに作られたノードの一つ「ComfyUI_LLMVISION」にマルウェアが仕込まれていることがわかりました。発覚後、ComfyUI_LLMVISIONのGitHubリポジトリが削除されています。

——————————————-

【技術解説】 2024-06-11 17:42:39 レコメンドアルゴリズム入門：基礎から応用まで実装に必要な知識を解説 – Qiita https://qiita.com/birdwatcher/items/b60822bdf9be267e1328

——————————————-

【AIの活用】 2024-06-11 18:00:00 New computer vision method helps speed up screening of electronic materials https://news.mit.edu/2024/new-computer-vision-method-helps-speed-screening-electronic-materials-0611

この記事は、太陽電池、トランジスター、LED、バッテリーなどの電子材料の性能を向上させるための新しい手法について説明しています。具体的には、人工知能(AI)を使って電子材料の候補を素早く探索し、その材料特性を迅速に評価する方法について紹介しています。

まず、研究チームは、材料候補を素早く見つけ出すためにAIツールを使っています。候補となる数億種類の化学組成から、有望な材料を特定することができます。また、同時に、AIアルゴリズムによって提案された材料組成を基に、大量の試料を短時間で印刷する機械を開発しています。

しかし、これまでこの最後の工程、すなわち新しく合成された材料の特性評価の方法が非常に遅いのが課題でした。これを解決するために、MITの研究チームは、コンピュータービジョンの手法を使って材料特性を迅速に評価する新しい技術を開発しました。

——————————————-

【新機能】 2024-06-11 18:43:17 Introducing Apple’s On-Device and Server Foundation Models https://machinelearning.apple.com/research/introducing-apple-foundation-models

Apple社は、2024年の世界開発者会議(WWDC)で、iOS 18、iPadOS 18、macOS Sequoiaに深く統合されたパーソナルインテリジェンスシステム「Apple Intelligence」を発表しました。

Apple Intelligenceは、ユーザーの日常的なタスクに特化したさまざまな高性能な生成モデルで構成されており、ユーザーの現在のアクティビティに合わせてオンザフライで適応できます。Apple Intelligenceに組み込まれた基礎モデルは、テキストの書き込みや洗練、通知の優先順位付けと要約、家族や友人とのコンバーセーションのためのユーモアある画像の作成、アプリ間の操作の簡略化など、ユーザーエクスペリエンス向けにファインチューニングされています。

——————————————-

【新機能】 2024-06-11 19:23:00 Private Cloud Compute: A new frontier for AI privacy in the cloud https://security.apple.com/blog/private-cloud-compute/

Apple社は、ユーザーデータのセキュリティとプライバシーを重要視しており、そのためにデバイス内部での処理を基盤としてきました。しかし、より高度な機能を提供するためには、クラウドの強力な機械学習モデルを活用する必要があります。そこで、Apple社は「Private Cloud Compute (PCC)」と呼ばれる新しいクラウドインテリジェンスシステムを開発しました。

PCCの特徴は以下の通りです。

1. 状態を持たない計算: ユーザーデータは処理中しか PCC 内部で利用せず、処理後には完全に削除されます。ユーザーデータはApple社のスタッフにも見られることはありません。

2. 強制可能な保証: PCCのセキュリティとプライバシーの保証は、ハードウェアとソフトウェアの両面で技術的に強制されています。特権的なアクセスを持つ運用者によるデータ漏洩を防ぐ仕組みが組み込まれています。

3. 非特定性: 特定のユーザーを狙った攻撃を防ぐため、ユーザー情報を含まない要求メタデータを使ってロードバランシングを行い、個別のノードを特定できないようになっています。

4. 検証可能な透明性: PCCのソフトウェアイメージを公開し、セキュリティ研究者が検証できるようにすることで、プライバシー保証の実現を裏付けています。また、ソースコードの一部公開やファームウェアの公開なども行う予定です。

2024/6/10のピックアップ

【スキルアップ】 2024-06-10 13:11:25 『GitHub CI/CD実践ガイド』でGitHub ActionsとCI/CDを体系的に学ぼう – 憂鬱な世界にネコパンチ！ https://nekopunch.hatenablog.com/entry/2024/06/10/115437

——————————–

【AIと法律・規制】 2024-06-10 15:16:00 NTT、グループ統一「AI憲章」規定　AI最高責任者・AIガバナンス室設置 https://www.itmedia.co.jp/news/articles/2406/10/news147.html

NTT（持ち株会社）は6月7日、AI活用をめぐり、グループと社員が心がけておくべき基本的な方針をまとめた「AI憲章「NTTグループAI憲章」を制定したと発表した。AIに関する最高責任者「Co-Chief Artificial Intelligence Officer」（Co-CAIO）も配置したほか、AIガバナンス室も新設し、AI活用のリスクを管理する。

——————————–

【スキルアップ】 2024-06-10 16:45:00 遊びながらAWSを学べる公式ゲーム“AWSクエスト”、スコア競うコンテスト開催 https://www.itmedia.co.jp/news/articles/2406/10/news167.html

——————————–

【マネジメント】 2024-06-10 18:05:00 夏休みの宿題は「プロジェクト管理」でやっつけよう　ヌーラボ、親子ワークショップ無料開催　全国4カ所で https://www.itmedia.co.jp/news/articles/2406/10/news166.html

プロジェクト・タスク管理ツール「Backlog」などを運営するヌーラボ（福岡県福岡市）は6月10日、プロジェクト管理の考え方を応用した親子向けイベント「自ら勉強したくなる！？　夏休みの宿題がどんどん進む親子ワークショップ」を7月に開催すると発表した。開催場所は東京、福岡、大阪、札幌の全国4カ所で、無料で参加できる。

——————————–

【国内ニュース】 2024-06-10 19:00:10 「マイナ救急」、全国消防本部へ実証事業拡大　マイナンバーカードを救急活用 https://www.watch.impress.co.jp/docs/news/1598901.html

消防庁は10日、マイナンバーカードを活用して、救急活動の迅速化を図る実証事業(マイナ救急)の今後の展開を発表した。

マイナ救急は、救急隊がマイナ保険証を活用して、傷病者情報を正確かつ早期に把握することで、救急活動の迅速化と円滑化を目指す取り組み。実証事業を5月23日から、平塚市消防本部、姫路市消防局、都城市消防局で開始しており、6月11日からは、仙台市消防局、前橋市消防局、鈴鹿市消防本部、彦根市消防本部などに拡げていく。

——————————–

【国内ニュース】 2024-06-10 20:43:34 ニコニコ、システム全体を再構築へ　サイバー攻撃の影響で　復旧の見込みは「今週中に告知」 https://www.itmedia.co.jp/news/articles/2406/10/news192.html

ドワンゴは6月10日、8日から続く大規模障害を巡り、今後の方針を発表した。10日午後6時時点で「サイバー攻撃の影響を受けずにニコニコのシステム全体を再構築するための対応を進めている」という。復旧予定やサイバー攻撃の詳細については「今週中に、役員の栗田穣崇およびCTO鈴木圭一が、復旧までの見込みおよびその時点までの調査で分かった情報を説明する予定」としている。

2024/6/9のピックアップ

【国内ニュース】 2024-06-09 06:31:04 サイゼリヤのスマホ注文が合理的なワケ　実体験で分かった“利用者ファースト”な仕組み https://www.itmedia.co.jp/mobile/articles/2406/10/news068.html

DX化を理由にタブレットを使う注文に切り替える外食チェーンはコロナ以降で増えた。かつて店員のiPod touchで注文をする方式を採用していたサイゼリヤも、この潮流に乗ると思われたが、注文の全てをスマートフォンやタブレットにせず、大きなメニューを見ながら注文したり、会計もあえてスマートフォン決済だけにしたりしないところは、利用者ファーストな考え方だ。

——————————–

【ロボット】 2024-06-09 20:20:10 最近話題の AI搭載の人型ロボットまとめ https://note.com/npaka/n/n1609fb929d22

2024/6/8のピックアップ

【動画生成AI】 2024-06-08 11:34:23 革命レベルの動画生成AI「Kling」　ついに「Sora」対抗が出てきた https://ascii.jp/elem/000/004/203/4203032/

中国のSNS「快手（Kuaishou）」は、テキストから最大2分間の動画を生成できる動画生成モデル「可灵（Kling）」を開発。多数のサンプル動画を掲載するデモサイトを公開した。

快手（Kuaishou）は中国のショート動画共有プラットフォーム。「TikTok」の中国版である「Douyin（抖音）」の主要な競合だ。

　Klingは、快手が自ら開発した「Large Vision Language Model（LVLM：画像処理可能な大規模言語モデル）」。効率的なトレーニングインフラと推論最適化により、最大2分間、30fpsのフルHD動画を生成できる。

　また、時間と空間を組み合わせた独自開発のアテンションメカニズム（注意機構）により、複雑な時空間の動きをより正確にモデル化し、物理法則に従ったダイナミックで大きな動きのある動画を生成できるという。

——————————————-

【国内ニュース】 2024-06-08 12:07:49 さくらインターネット田中社長「国産クラウドでアマゾンに挑む」 https://business.nikkei.com/atcl/NBD/19/00119/00256/

昨年、政府・自治体システムの共同基盤となる「ガバメントクラウド」の事業者に選ばれた。「アマゾン・ウェブ・サービス（AWS）」などの米IT大手4社に続き、初の日本企業となる。国内唯一のクラウド専業としての誇りを胸に大仕事に挑む。

——————————————-

【人間とAIの未来】 2024-06-08 12:38:19 AGIと超知能がもたらす未来を予見：元OpenAIメンバーが描く衝撃のシナリオ「世界は間もなく気付くが、現時点でそれを理解している者は数百人のみ」 | Ledge.ai https://ledge.ai/articles/former_openai_member_warns_situational_awareness

元OpenAIのSuperalignmentチームメンバーであるレオポルド・アッシェンブレナー氏は2024年6月、AIのセキュリティ上の懸念を取締役会に伝えたためにOpenAIを解雇されたと主張していることが、各メディアで報じられている。

同氏は「SITUATIONAL AWARENESS: The Decade Ahead」というブログ記事を公開し、AI技術の進展とその影響について詳細なシナリオを提示した。同記事では、特にAGI（人工汎用知能）の進展とその後のスーパーインテリジェンスへの移行に伴う課題とリスクについて述べられている。この記事の内容は、現時点で世界中で数百人しか理解していないとアッシェンブレナー氏は述べている。

——————————————-

【新機能】 2024-06-08 13:05:35 「Copilot+ PC」のイチオシ新機能「Recall」、初期設定でユーザーがON/OFF選択 https://www.watch.impress.co.jp/docs/news/1598541.html

Microsoftは7日(米国時間)、同社が提案する新PCブランド「Copilot+ PC」の目玉機能である「Recall(リコール/回顧)」についての仕様変更を発表した。利用開始前に、ユーザーがRecallのON/OFFを明示的に選択する形になる。

「Recall」はPC上の作業において、自動的スナップショットを撮影し、オンデバイスAIによってインデックス化。曖昧な言葉で、ファイルや作業内容に見つけ出せるようになる機能。ファイル名や場所などがわからなくても、「赤い納屋を探す(Find the red barn)」と検索すると、赤い納屋を使ったパワーポイント資料を見つけられる、といった形で利用できる。

——————————————-

【国内ニュース】 2024-06-08 23:59:45 ニコニコに大規模なサイバー攻撃　「週末の復旧は困難」 https://www.watch.impress.co.jp/docs/news/1598555.html

2024/6/7のピックアップ

【ニュース】 2024-06-07 00:40:00 SpaceXの巨大宇宙船「Starship」、帰還に初めて成功　4度目の打ち上げで https://www.itmedia.co.jp/news/articles/2406/07/news083.html

米SpaceXは6月6日（現地時間）、超大型宇宙船「Starship」の4回目の打ち上げを実施した。Starshipは、軌道投入したのち地球への再突入を実行。途中Starshipを覆う耐熱タイルが多数剥がれ、フラップも損傷を受けるなどのトラブルに見舞われたものの、無事着水に成功。「再利用できる超大型宇宙船」へ大きく前進した。

再利用可能なスペースシャトルの実現に一歩近づきましたね。とはいえ、かなり機体が破損したようなので、簡単に再利用とはいかないんだろうなあと思いますが。

——————————————-

【技術解説】 2024-06-07 11:20:53 めちゃ便利になった無料版「ChatGPT」新機能の使い方まとめ【最新版】 (1/5) https://ascii.jp/elem/000/004/202/4202486/

GPT-4oが使えるようになった（回数制限あり）
- 最高性能のGPT-4は使えない
写真を入力にできるようになった（3枚程度）
ブラウザ機能（ネット検索）が使えるようになった
PDFファイルの読み込みができるようになった
Advanced Data Analysis (旧Code Interpreter)を使ってデータ分析できるようになった
GPTsストア（カスタムGPT）を使えるようになった（作るのは不可）
DALL-Eによる画像生成はできない

——————————————-

【LLM】 2024-06-07 12:42:08 Extracting Concepts from GPT-4 https://openai.com/index/extracting-concepts-from-gpt-4/

【AIによる要約】

言語モデルの内部構造を理解することは、AI安全性を確保する上で非常に重要です。しかし、ニューラルネットワークは直接設計できず、構成要素を同定することが難しいため、従来の方法では言語モデルの動作を理解するのは困難でした。

そこでOpenAIの研究者らは、スパースオートエンコーダーを使って言語モデルの内部表現を分解し、16 million もの解釈可能な特徴量を発見しました。この手法は既存のものよりも高スケーラビリティを示し、GPT-4 の内部表現を分析することに成功しています。発見された特徴量の中には、「人間の不完全さ」「価格上昇」「数式演算」など、人間にとって意味のある概念を表すものが多数あることが確認されています。

ただし、この手法にも限界があります。多くの特徴量の解釈はまだ困難であり、モデル全体の振る舞いを完全に説明するには膨大な数の特徴量が必要となる可能性があります。また、特徴量の発見はモデルの解釈に向けた第一歩に過ぎず、モデルがどのように特徴量を組み合わせて出力を生成しているのかを理解することも重要です。

研究者らは今回の成果を論文と共にオープンソース化し、他の研究者による追加的な探索を促しています。この分野の研究が進めば、言語モデルの挙動をより深く理解し、安全性を高める新たな方法が見出されることが期待されます。

——————————————-

【ニュース】 2024-06-07 13:30:45 未成年の性的コンテンツ拡散を防ぐ「Take It Down」が日本語対応 Meta https://www.watch.impress.co.jp/docs/news/1598245.html

Metaは、米国の民間非営利団体「全米行方不明・被搾取児童センター National Center for Missing & Exploited Children(NCMEC)」と協働し、18歳未満の時に撮影された性的な画像や動画の拡散を防ぐためのプラットフォーム「Take It Down(テイクイットダウン)」の日本語版を開始した。

Take It Downは未成年者を含む若い世代が、自分自身の性的な画像や動画のコントロールを取り戻す手助けをするプラットフォーム。5月末から日本語でも利用可能になった。年齢を問わず誰でも利用可能。

——————————————-

【国内ニュース】 2024-06-07 15:45:00 自社の製品画像を学習した生成AI環境構築　おもちゃのデザイン案、100倍に拡大　セガサミー https://www.itmedia.co.jp/news/articles/2406/07/news151.html

セガサミーホールディングスは、自社の製品画像を学習した画像生成AI環境を構築し、特定の商品デザインに生かす実証実験で、デザイン案の件数を、従来の100倍に増やすことができたと発表した。

——————————————-

【科学技術】 2024-06-07 16:28:00 津波の高さを海底光ファイバーの歪みから推定できる可能性　JAMSTECが公表 https://www.itmedia.co.jp/news/articles/2406/07/news161.html

——————————————-

【国内ニュース】 2024-06-07 16:30:39 エンジニア兼作家が東京都知事選挙の出馬表明記者会見をした会見全文｜安野たかひろ https://note.com/takahiroanno/n/nead5c2e2454b

——————————————-

【ニュース】 2024-06-07 17:00:21 アドビ基本利用条件のアップデートに関するお知らせ https://blog.adobe.com/jp/publish/2024/06/07/corp-clarification-adobe-terms-of-use

——————————————-

【国内ニュース】 2024-06-07 17:09:00 能動的サイバー防御、早期の法案取りまとめ指示　首相「急を要する」　有識者会議初会合 https://www.itmedia.co.jp/news/articles/2406/07/news174.html

政府は6月7日、サイバー攻撃に先手を打って被害を未然に防ぐ「能動的サイバー防御」に関する有識者会議の初会合を首相官邸で開いた。岸田文雄首相は「サイバー対応能力の向上は、ますます急を要する課題だ」と述べ、早期に関連法案を取りまとめるよう河野太郎デジタル相に指示した。政府は早ければ秋の臨時国会への法案提出も視野に入れる。

——————————————-

【ニュース】 2024-06-07 17:20:15 生成AIの台頭に伴うABCにおけるルール変更について – AtCoder　 https://atcoder.jp/posts/1246

【AIによる要約】

AtCoderは、ABC、ARC、AGCの3つのアルゴリズム系コンテストを開催しています。

ABCは教育的な部分を重視しており、典型的な問題を出題しています。生成AIが解ける問題が多いため、生成AIの利用が競技性や教育価値を低下させると考えています。

ARC/AGCでは、柔軟な発想を要求する問題が多く、生成AIが解ける問題は少ないため、生成AIの使用制限は考えていません。

今後、問題選定の段階で生成AIが単独で解ける問題はARC/AGCには出題しない方針です。

生成AIの利用も含めた問題解決能力を競うことに意味があると考えています。

不正行為の摘発は難しいため、参加者の良心に依存しています。文化を守るために協力をお願いします。

明らかなルール違反が多く検出された場合、特定コンテストへのアクセス禁止や法的措置を含む対応を考えています。

生成AIの進化やユーザーの動向に応じて、特定のサービスの利用を禁止するなどの制限を加える可能性があります。

——————————————-

【国内ニュース】 2024-06-07 18:35:55 ソフトバンク、シャープ堺工場にAIデータセンター　液晶からAIへ https://www.watch.impress.co.jp/docs/news/1598424.html

ソフトバンクとシャープは、堺市にあるシャープの液晶パネル工場関の土地と建物を活用した大規模なAIデータセンターの構築に向けて、基本合意書を締結した。

ソフトバンクは、シャープ堺工場の敷地面積全体の約6割に当たる約44万m2の敷地と、延べ床面積約75万m2の建物に、受電容量が約150MW規模のデータセンターを構築し、2025年中の本格稼働を目指す。将来的には、受電容量を400MW超の規模まで拡大する見込み。

——————————————-

【ニュース】 2024-06-07 19:00:00 MetaのAI施策に反発する形でアンチAIプラットフォーム「Cara」のユーザー数が1週間で17倍超に増加 https://gigazine.net/news/20240607-anti-ai-platform-cara-has-grown-to-700k-users/

——————————————-

【国内ニュース】 2024-06-07 20:42:00 「もう限界です」──国立大学協会が声明、財務悪化の現状を訴える　「教育・研究の質の低下が危惧される」 https://www.itmedia.co.jp/news/articles/2406/07/news194.html

——————————————-

【新サービス】 2024-06-07 20:57:00 「GPT-4 Turbo」など無料で使えるプラットフォーム提供　韓国スタートアップが28億円調達https://www.itmedia.co.jp/news/articles/2406/07/news193.html

「GPT-4 Turbo」などの生成AIを無料で使えるプラットフォームを提供する韓国Wrtn Technologies（リートンテクノロジーズ）は6月7日、日本、米国、韓国のベンチャーキャピタルなどから28億4000万円を調達したと発表した。調達資金は製品・サービスの開発と高度化に充てる。

2024/6/6のピックアップ

【ニュース】 2024-06-06 08:40:00 NVIDIA、Apple抜いて時価総額で世界2位に　3兆ドル突破 https://www.itmedia.co.jp/news/articles/2406/06/news089.html

これはちょっと投機な感じがします。NVIDIAは特別なGPUを作っているというよりは、AIのフレームワークなどがNVIDIAのGPU上で動作するためのCUDAというプラットフォームを前提としているから優位なんですよね。逆に言えばそこを崩せればNVIDIA一強は終わる。

以前、ARMやIntel、富士通などが連合してNVIDIAに対抗するというニュースがありました。 https://pc.watch.impress.co.jp/docs/news/1596434.html

一社独占というのはあまりいいことではないと思うので、この連合がこれからどう展開していくか注目しています。

——————————–

【画像生成AIの評価】 2024-06-06 09:00:00 Launching the Artificial Analysis Text to Image Leaderboard & Arena https://huggingface.co/blog/leaderboard-artificial-analysis2

【AIによる要約】

Artificial Analysis のText to Image Leaderboardは、人間の好みに基づいたランキングでこれらの質問に回答しようとしています。45,000件以上の人間の画像プリファレンスデータに基づいて、ELOスコアが算出されています。このリーダーボードには、Midjourney、OpenAIのDALL・E、Stable Diffusion、Playgroundなど、主要なオープンソースおよび独自のイメージモデルが掲載されています。

この評価方法は、言語モデルなどの他のAIモダリティに比べて、人々の画像に対する好みの変動が大きいため、従来は非常に困難でした。しかし、Artificial Analysisのイメージアリーナは、大規模な人間の好みデータを収集する群衆調査アプローチを用いることで、主要モデル間の比較を可能にしています。

評価の結果、独自モデルがリードしているものの、オープンソースモデルも急速に追いついてきているようです。特に、Playground AI v2.5がDALL・E 3を抜いて上位に躍り出ています。一方で、DALL・E 2は前年までの圧倒的なリーダーから地位を落としています。また、Stable Diffusion 3 Mediumがオープンソース化されれば、オープンソースコミュニティにとって大きな追い風になると考えられます。

ユーザーはこのリーダーボードサイトでモデルの順位を確認したり、自身の好みに基づいた個人的なランキングを作成したりできます。Artificial Analysisは、Twitterやウェブサイトでも関連するサービスを提供しており、ユーザーからのフィードバックも歓迎しています。

画像生成AIの評価に関する記事ですね。Hugging Faceは機械学習の分野で広く使用されるオープンソースソフトウェアとサービスを提供する企業です。特に、AIモデルの開発と共有のためのプラットフォームとして知られています。特に有名なのは「Transformers」ライブラリがあります。このライブラリは、BERT、GPT、T5など、最先端のトランスフォーマーベースのモデルを簡単に利用できるように設計されており、Pythonプログラミング言語で利用可能です。

Hugging Faceのブログをチェックしていますが、最近はこのようなLLMの評価に関する記事もよく出ています。

——————————–

【ニュース】 2024-06-06 09:00:00 都内にドローン実験場「板橋ドローンフィールド」 https://www.watch.impress.co.jp/docs/news/1597752.html

都内では都立公園をはじめとしてほとんどの場所でドローンを飛ばすことが禁止されているので、このような専用のフィールドはいいですね。

——————————–

【音楽生成AI】 2024-06-06 11:47:00 Introducing Stable Audio Open – An Open Source Model for Audio Samples and Sound Design https://stability.ai/news/introducing-stable-audio-open

【AIによる要約】

Stable Audio Openは、テキストから最大47秒の音声サンプルや効果音を生成できる、オープンソースのモデルです。ユーザーはドラムビート、楽器のリフ、アンビエントサウンド、フォーリー効果、音楽制作用の要素などを生成することができます。また、このモデルは音声サンプルの変形や音声のスタイル転移も可能にしています。

このオープンソースのリリースは、サウンドデザイナー、ミュージシャン、クリエイティブなコミュニティに向けて、ジェネレーティブオーディオの機能を提供することを目的としています。Stable Audio Openは、Freesoundやフリー音楽アーカイブのデータを使って学習されており、クリエイターの権利を尊重しながら開発されています。

Stable Audio Openは、Stable Audioの商用製品とは異なり、短い音声サンプルやサウンド効果の生成に特化しています。一方でStable Audioは、最大3分の高品質な楽曲の生成や、オーディオ間の変換、調和の取れた多パート作曲などの機能を有しています。

Stable Audio Openの学習済みモデルはHugging Faceで公開されており、サウンドデザイナー、ミュージシャン、開発者、オーディオ愛好家などに活用されることが期待されています。

音楽生成AIはSunoが有名ですね。https://suno.com/

わたしも使ってみたことがありますが、日本語の歌も問題なく歌ってくれてなかなかクオリティが高いです。しかし、音楽生成AIは今回のStable Audio Openも含めてまだ1分程度の音楽しか生成できません。

Stability AIは著作権フリーであること、商用利用可能であることにできるだけこだわって生成AIを開発しており好感が持てます。

でも経営状態はあまりよくないという噂もありちょっと心配しています。 https://gigazine.net/news/20231130-stability-ai-acquisition/

AI総合研究所

——————————–

【スキルアップ】 2024-06-06 13:28:11 最初から完ぺきを求める必要はない。10年かけて、英語で生活できるようになった話 | レバテックラボ（レバテックLAB） https://levtech.jp/media/article/column/detail_451/

——————————–

【AIの活用】 2024-06-06 14:10:07 Introducing Aurora: The first large-scale foundation model of the atmosphere https://www.microsoft.com/en-us/research/blog/introducing-aurora-the-first-large-scale-foundation-model-of-the-atmosphere/

【AIによる要約】

マイクロソフト研究所のチームが新しい人工知能（AI）ベースの気象予測モデル「Aurora」を開発しました。Aurora は、1.3億パラメーターを持つ柔軟な3次元Swin Transformerアーキテクチャを採用しており、気象データの多様性を活かすことで高精度な予報を実現しています。Aurora は、気象シミュレーションデータを1,000万時間以上学習することで、大気の動態を包括的に理解しています。さらに、0.1度（約11km）の高解像度で予報を行うことで、詳細な大気プロセスを捉えられるようになっています。

Aurora の効率性も注目に値します。従来の数値気象予報システムと比べて、計算速度は約5,000倍高速だと推定されています。また、温度や風速といった気象要素だけでなく、大気汚染レベルや温室効果ガスの濃度など、幅広い大気変数を予測することができます。

Aurora の実力は、グラフキャストやIFS-HRESといった最先端のモデルと比較しても際立っています。極端値の予測や、気象観測データとの適合性において、Aurora は優れた性能を発揮しています。

このように、Aurora は気象予報の精度向上に大きく貢献することが期待されています。さらに、地球システム全体をカバーする基盤モデルの開発につながる可能性も秘めています。データ不足の地域でも高品質な気象情報を提供できるようになれば、農業、交通、エネルギー利用、災害対策など、さまざまな分野での適応力向上に寄与するでしょう。AI技術の飛躍的な進歩により、より正確で迅速な気象予報の実現に向けた道が開かれつつあります。

気象予報に関するAIはGoogleも最近出していました。 https://research.google/blog/generative-ai-to-quantify-uncertainty-in-weather-forecasting/

地球温暖化に伴い、洪水や台風などの災害が多くなっているので、AIで正確に予測できるようにしたいというニーズがあるようです。

日本のように気象衛星を飛ばせる国は少ないと思うので、AIのサポートを得て地球全体の天気予報ができるようになると災害の被害を減らせるかもしれません。

——————————–

【新サービス】 2024-06-06 20:00:00 NotebookLM を日本語でも提供開始。ウェブサイトや Google スライドにもサポート https://blog.google/intl/ja-jp/company-news/technology/notebooklm-google/

【AIによる要約】

Google は昨年、AIを活用したリサーチや執筆アシスタントである NotebookLM を発表しました。

Gemini 1.5 Pro を搭載した更新版の NotebookLM を日本語を含む言語で 200 以上の国と地域に順次提供します。

NotebookLM は複雑な資料の理解、情報から新しい類似性の発見、下書きの作成を支援します。

研究論文、取材記録、仕事のドキュメントなどの参照文献をアップロードすると、NotebookLM がこれらを理解しサポートを提供します。

新機能として、Google ドキュメント、PDF、テキストファイルに加えて、Google スライドと Web URL をソースとしてサポートします。

インラインでの引用機能が追加され、ソース内の参照箇所に直接移動可能です。

Notebook ガイドが、ソースをFAQやブリーフィングドキュメント、学習ガイドなどの形式に変換します。

Gemini 1.5 Pro のマルチモーダリティにより、スライドやドキュメント内の画像、グラフ、図についても質問可能です。

これはすごいです！PDFをダイレクトに突っ込んでもいいですし、Googleドライブと連携させれば、自分のドキュメントに基づいてチャット形式で生成AIに質問できます。これはRAGをわざわざ実装しなくても良くなるかもしれません。

Googleのアカウントがあればすぐに使うことができます。

論文を読むのにとても便利そうなので、活用していきたいです。

注意点としては、まだExperimental（試験運用）なので、今後有料化の可能性があることですね。有料でもこれは使いたいかもしれない。

——————————–

【LLMの評価】 2024-06-06 22:49:44 To Believe or Not to Believe Your LLM https://arxiv.org/abs/2406.02543

【AIによる要約】

LLMを使用する際に、応答の不確実性が大きいときを特定することを目的としています。epistemic uncertainty(事実や言語に関する知識不足)とaleatoric uncertainty(答えの多様性による不確実性)の両方を同時に考慮しています。具体的には、単一の応答だけでなく複数の応答の場合においても、epistemic uncertaintyが大きい場合(ファクトを誤って伝えるハルシネーション)を正確に検出できる情報理論的な指標を導出しました。この指標は、モデルの出力のみに基づいて計算することができ、反復的な入力prompting(前の応答を利用する)を行うことで算出できます。

一般的な不確実性定量化手法(応答の対数尤度のしきい値を使う等)では、複数の答えがある場合のハルシネーションを検出できませんが、提案手法では可能です。一連の実験により、提案手法の有効性を実証しています。さらに、反復prompting操作によって、LLMが出力する確率分布が増幅される現象についても分析しており、これは独立した興味深い知見です。

モデルの出力からそれが誤り（ハルシネーション）であるかどうかを検出する指標を開発したとのことです。

LLMは「次に続く確率が最も高い単語を出力している」だけなので、その出力結果が正しいかどうかはわからない、もっともらしいうそをつくことがあるというのがとても問題です。もしも、この技術によって、出力だけから嘘かどうか判定できるとしたらLLMを利用しやすくなりそうです。

2024/6/5のピックアップ

【科学技術】 2024-06-05 08:24:10 「なぜ時間は過去→未来にしか進まない？」を“量子もつれ”で説明か　未解決問題「時間の矢」に切り込む　https://www.itmedia.co.jp/news/articles/2406/05/news045.html

普段感じている時間は、過去から未来へと一方向にしか流れていかない。このような時間が一方向に進む概念を「時間の矢」と呼び、物理学の未解決問題の一つとしている。この時間の矢を説明する新しい考え方を提案したのがこの研究である。

（中略）

まとめると、この研究では、時間の矢について新たな視点を提供している。具体的には、宇宙の初期量子状態が非常に低い量子もつれを持っていたという「量子もつれの過去仮説」を提唱。この仮説に基づき、量子デコヒーレンスというプロセスが時間の一方向性を説明する鍵となる。デコヒーレンスは、環境と絡み合うことで生じる不可逆的なプロセスであり、量子もつれの増加がその証拠となる。

——————————–

【開発技術】 2024-06-05 08:50:09 JavaScriptの標準規格「ECMAScript」を見直す。これからの注目機能も紹介　https://levtech.jp/media/article/column/detail_450/

——————————–

【開発技術】 2024-06-05 10:46:42 ユニットテストってもう言わない！ CI/CD時代のテスト分類に最適なテストサイズという考え方　https://zenn.dev/koduki/articles/e0f8824adbe0e9

以前からユニットテスト/単体テストという言葉は使いづらい、と感じており今回も旧Twitterで「テストを実行時間ベースで分類する良い言葉ないかなー」と呟いていたところ、「テストサイズのSMLって考え方があるよ」と教えて戴きました。

これは最近わたしも悩んだところでした。単体テストやって、といわれたけど、PyTestでテストコード書いて自動化するとしたらどこまでが単体でどこからが結合なの？そのうえGitHub ActionsのようなCI/CDを導入するとよりわけがわからなくなります。

Googleが提唱しているテストサイズのS, M, Lという考え方を紹介してくださっています。

テストサイズでは、実行時間やテストに使用される実行場所に注目します。これによってSmall、Medium、Large、Enormousの分類に分けます。特に、SMLの３つの分類がよく使われる定義です。

——————————–

【開発技術】 2024-06-05 11:04:37 中級 Vim 操作　https://zenn.dev/vim_jp/articles/2024-06-05-vim-middle-class-features

サーバーの中に入って作業するときに、IDE（統合開発環境）がない場合があって、でもプログラムやテキストを編集する必要があることがあります。そういうときにviやvimを結構使っています。この記事は中級編ということで知らない便利テクニックがあって勉強になりました。

——————————–

【国内ニュース】 2024-06-05 11:34:07 世界初の技術で企業ニーズに対応した特化型生成AIを自動生成！エンタープライズ生成AIフレームワークを提供　https://pr.fujitsu.com/jp/news/2024/06/4.html

【AIによる要約】

富士通は、企業向け生成AIの活用を促進するエンタープライズ生成AIフレームワークを開発し、2024年7月から提供開始します。

フレームワークはナレッジグラフ拡張RAG、生成AI混合技術、生成AI監査技術で構成されており、企業の大規模データや法令への準拠に対応した特化型生成AIを自動生成します。

ナレッジグラフ拡張RAGは、LLMの参照データ量を1,000万トークン以上に拡大します。

生成AI混合技術は、企業のニーズに応じて最適な生成AIモデルを自動生成し、迅速に提供します。

生成AI監査技術は、生成AIの回答が企業規則や法令に準拠しているかを監査し、信頼性を高めます。

実証実験で契約書チェック工数削減、サポートデスク効率向上、運輸業での計画策定時間短縮などの効果が確認されています。

今後、日本語やコード生成など多種多様な特化型生成AIモデルを追加予定です。

経済産業省のプロジェクト「GENIAC」に採択され、ナレッジグラフ拡張RAGのセキュアなオンプレミス環境での利用を目指します。

2024/6/4のニュースピックアップでも紹介したナレッジグラフ拡張RAGですね。

社内文書や機密文書をLLMに読み込ませて、それを理解させたうえで生成したい、という要望からRAGが注目されているわけですが、どこもセキュリティを心配しているんですよね。なので、AWSやAzure, Google Cloud上にLLMサービスを構築する…ということを考えることになりますが、それもなかなか大変。富士通のこれはそういうのを一括でやってくれるフレームワークということかなと思いました。

ただ、「特化型生成AIを自動生成します」とのことですが、本当にいい感じのものができるのだろうか？実際はかなり用途に合わせてパラメータなどをチューニングしないといけないと思うので、そんなに簡単に使えるのかなあというのが感想です。

——————————–

【技術解説】 2024-06-05 12:26:10 ChatGPT vs. Wikipedia──生成AIの登場でウィキペディアはどう変わったか？　英国の研究者らが調査　https://www.itmedia.co.jp/aiplus/articles/2406/05/news044.html

英キングス・カレッジ・ロンドンに所属する研究者らが発表した論文「Exploring the Impact of ChatGPT on Wikipedia Engagement」は、2022年11月にChatGPTが一般公開されたことを受け、Wikipediaの利用状況にどのような変化が生じたのかを調査した研究報告である。

（中略）

ChatGPTが登場後もほぼ全ての言語でWikipediaの利用者は減ることなく、むしろ増加したということだ。

（中略）

研究者たちは、編集行為がページ閲覧に比べてコミュニティー主導の社会的活動であるため、ChatGPTの影響を受けにくかったと考察している。Wikipediaでは、編集者同士の相互作用やコミュニケーションが重要な役割を果たしており、それがChatGPTのような自動化ツールへの抵抗力になっている可能性がある。

意外な結果ですが、そこまでChatGPT使っている人が多くないということなのでしょうか？まだググっている人も多いのでしょうし、生成AIの結果よりはwikipediaのほうが信用できるから両方見ている人もいそうな気がします。（わたしも確認することがあります）。

また、編集作業は検索とはまた別の力学が働いていそうですね。

——————————–

【人間とAIの未来】 2024-06-05 14:05:00 A Right to Warn about Advanced Artificial Intelligence 　https://righttowarn.ai/

【AIによる要約】

人工知能(AI)技術は人類に前例のない恩恵をもたらすことが期待されているものの、深刻なリスクも伴っています。AI企業自身や政府、研究者らも、これらのリスクを認識しており、適切な対策が必要だと指摘しています。

しかし、AI企業には効果的な監視を回避するための強い財政的動機があり、企業統治の仕組みだけではこの問題を解決するには不十分です。AI企業は、システムの能力や限界、防護措置の適切性、さまざまな被害のリスクレベルなどの非公開情報を持っていますが、政府や市民社会に自発的に共有する義務はほとんどありません。

OpenAIの現在および元従業員は、これらの企業を公衆に対して説明責任を負わせる数少ない人々です。しかし、広範な守秘義務によって、自社の問題点について公に議論することが制限されています。また、多くのリスクが未だ規制対象外であるため、一般的な内部告発者保護制度では不十分です。さらに、業界全体で起きてきた報復事例を考えると、従業員が懸念を表明することに合理的な恐れを感じるのは当然です。

そこで、AIフロンティア企業に対し、次のような原則を遵守することを求めます。

1. 企業は「批判的言論」の禁止や、リスク関連の批判への報復を行わないこと。

2. 現在および元従業員がリスク関連の懸念を匿名で企業の取締役会、規制当局、専門家組織に伝えられる仕組みを整備すること。

3. 企業は現在および元従業員がリスク関連の懸念を公に表明することを許容すること。ただし、営業秘密や知的財産権は適切に保護されるべきです。

4. 適切なプロセスが整っていない場合、現在および元従業員がリスク関連の機密情報を公表することについて、企業は報復を行わないこと。

これらの原則に従うことで、AI企業はステークホルダーに対する透明性と説明責任を高め、適切なリスク管理体制を構築できるはずです。

少し前に、こんな報道が。

OpenAIが退職した従業員に対して、「OpenAIに対する批判をしない」ことを求める書類への署名を求め、署名を拒否した場合には既得の株式を放棄するように迫っていたことが報じられました。https://gigazine.net/news/20240523-openai-nondisparagement-obligations/

うーんOpenAIってなかなかのヤクザ企業なのでは…？

「AIはどんどん開発してAGI（汎用人工知能）をつくろう！SFの世界を実現するんだ！」みたいなノリでどんどん進めてしまっていますが、本当はもっと慎重に進めるべきだと思いますし、実際、そうすべきだと考える人達がOpenAIやGoogleをやめてCohereやMistral AIを作っていますね。企業の競争原理が働いて歯止めが効かなくなっていますが、そこをコントロールすることが必要です。今回の、OpenAIやGoogleのDeepMindの社員＆元社員の有志による声明をきっかけに潮目が変わるといいのですが…

——————————–

【国内ニュース】 2024-06-05 17:06:00 リコーと理研「技術の実用化の兆し」判別するアルゴリズムを開発　https://www.itmedia.co.jp/news/articles/2406/05/news169.html

【AIによる要約】

株式会社リコーと理化学研究所数理創造プログラムは、新しいアルゴリズムを開発しました。このアルゴリズムは、特許と論文に共通して出現するキーワードを多重解析して、技術の「実用化の兆し」を数値で判定できます。

この技術は特許出願済みです。

リコーは、この技術を活用してデータドリブンなリサーチを行い、研究開発のテーマ探索活動の網羅性やスピードを強化し、新たな研究テーマと価値の高い知的財産の創出に貢献します。

これは特許と論文の数が少ないとうまく判定できないのでは？技術って一本の論文や

特許から爆発的に実用化することもあると思うので、この研究がどれくらい意味があるのかちょっとわからなかったです。

研究開発のテーマ選びとしてはたしかに流行りそうなところに選択と集中、というのはありなのかもしれませんが、一発大逆転みたいな基礎研究を頑張ってほしい気持ちがあります。

——————————–

【国内ニュース】 2024-06-05 18:10:40 パナソニック×JAXA、月面探査ローバー向け運転支援AI開発へ　https://www.watch.impress.co.jp/docs/news/1597729.html

2024/6/4のピックアップ

【ニュース】 2024-06-04 06:00:00 Japan’s push to make all research open access is taking shape https://www.nature.com/articles/d41586-024-01493-8

【AIによる要約】

日本政府は、公的資金を得た研究成果を無料で閲覧できるようにする計画を進めています。2025年4月から、政府の助成を受けた研究者に対して、自施設のリポジトリで論文を無料公開することが義務付けられます。この計画により、日本の研究情報の長期的な追跡性が高まり、二次研究の促進や共同研究の活性化が期待されています。

日本は、アジアの国々の中で研究のオープンアクセス化に先駆的に取り組む国の1つです。2022年にはアメリカでも、納税者資金を得た研究成果を2026年から無料公開する義務付けが行われました。

日本政府は、この計画を実現するために、大学のリポジトリを標準化するために1000億円を投資します。日本には800以上の大学がありますが、そのうち750以上がすでにリポジトリを持っています。各大学が所属する研究者の成果を保管しますが、その基盤となるソフトウェアは統一されます。

日本はまた、2022年に独自の preprint サーバー「Jxiv」を立ち上げましたが、現時点では利用が限定的です。論文をpreprint として公開することが、日本の研究者にとってまだ一般的ではありません。

日本の取り組みは主に「グリーンOA」に焦点を当てています。つまり、査読済みだが未確定の原稿をリポジトリで公開することです。一方、出版社に料金を支払って最終版を無料公開する「ゴールドOA」は、費用が高すぎるため実現が難しいとされています。

この計画は、日本の研究水準の低下に対する対応策の1つでもあります。日本の論文被引用数トップ10%の割合は6%から2%に低下し、世界5位の研究論文数を誇るにもかかわらず、13位にランクされるなど、日本の研究力が相対的に低下しています。日本政府はこの傾向に歯止めをかけるため、2040年までに博士号取得者を3倍に増やすことを目指しています。

論文ジャーナルの購読料ってものすごく高額みたいなので（年間数百万単位と聞いたことがあります）、オープンアクセス化できたら論文にアクセスしやすくなって読みやすくなる＆読んでもらいやすくなる、ということなのでしょうか。

物理学やコンピュータサイエンスの分野はarXivのようなプレプリント文化があって、だれでもアクセスできるのはいいなと思います。一方で、査読がないとクオリティを保てないというのもあり…査読文化も研究者の善意で成り立っているので、ときには悪意のある査読が行われることもあります。個人的には査読やジャーナルのありかたも含めて議論が必要かなと思います。

——————————–

【マネジメント】 2024-06-04 07:07:04 【資料公開】ステークホルダーとの付き合い方を考える https://www.ryuzee.com/contents/blog/14591

2024年6月3日に行われたソニー主催、Forkwell共催の勉強会「TechLovers #2」の登壇資料を公開します。

ステークホルダーのタイプごとに、求めているものや必要な対応を分析して表にまとめておくというのはすごく良さそうだなと思いました。

——————————–

【ニュース】 2024-06-04 07:16:00 Amazon、生成AIによる出荷前問題検出システム「Project PI」導入 https://www.itmedia.co.jp/news/articles/2406/04/news087.html

米Amazonは6月3日（現地時間）、生成AIとコンピュータビジョンを使って出荷前の商品に問題がないかチェックするシステム「Project PI」（PIはPrivate Investigator；私立探偵の略）を発表した。北米の一部のフルフィルメントセンターで稼働している。

——————————–

【ニュース】 2024-06-04 12:45:26 X、成人向けコンテンツのポリシーを変更　「ラベル」を必須に https://www.watch.impress.co.jp/docs/news/1597216.html

——————————–

【その他】 2024-06-04 13:37:50 【研究成果】楽観的になれば先延ばし癖は改善する!? ――新指標が明らかにする、「希望」の重要性https://www.c.u-tokyo.ac.jp/info/news/topics/20240530140000.html

東京大学大学院総合文化研究科の開一夫教授と、博士課程の柏倉沙耶らによる研究グループは、「今よりも未来のストレスが増えることはない」と信じる未来楽観思考の人は、深刻な先延ばし（注１）癖が少ないことを発見しました。

　本研究では「時系列的ストレス観」と「時系列的幸福観」（注２）という新指標を導入することで、先延ばし癖のある人が未来に対して抱く印象をこれまでにない新たな切り口でより定量的に測定することが可能になりました。この研究成果から、深刻な先延ばしを減らし、将来のために行動できるようになるには、未来に希望を持つことや、希望を持てるようなサポートを受けることが重要であることが示唆されました。

——————————–

【国内ニュース】 2024-06-04 16:03:00 全国交通系ICカードは止めます──熊本市のバス、市電が苦渋の決断　市長「同様の自治体が出てくるのでは」 https://www.itmedia.co.jp/news/articles/2406/04/news151.html

熊本県内を運行する路線バスでは、12月中旬にも「Suica」などの全国交通系ICカードが使えなくなる。原因は、読み取り機器の更新費用が高価で見合わないこと。熊本市の大西一史市長は、同市が「交通系ICカードから離脱する全国初の自治体になった」と話す。

ユーザーとしては全国共通のICカードが使えたほうが便利なんですけど、読み取り機器の更新費用が高い、というのは盲点でした。

熊本市では代わりにクレジットカードなどのタッチ決済を導入するそうで、利便性がどうなるか気になるところです。

QRコードで読み取り…はちょっと考えましたけど、一瞬で決済できないといけないとなると不都合が多そう。

——————————–

【つくってみた】 2024-06-04 16:15:39 Raspberry Pi 5にCore Ultra超えのAI専用プロセッサを追加できる「Raspberry Pi AI Kit」を取り付けてAIカメラ化してみたよレビュー https://gigazine.net/news/20240604-raspberry-pi-ai-kit-npu-m2/

「Raspberry Pi AI Kit」は、Raspberry Pi 5に13TOPSの処理性能を備えたAI処理専用チップを追加できる外付けキットです。そんなRaspberry Pi AI KitがRaspberry Pi開発チームから届いたので、Raspberry Pi 5への取り付け方法や実際の動作を確かめてみました。

楽しそう！以前電子工作をやっていた時があり、ラズパイも持っているのですが、全然活用できていない…外付けキットを追加すればいいみたいなので、これは試してみたいです。

——————————–

【国内ニュース】 2024-06-04 17:50:00 LINEヤフー「脱NAVER」へ高いハードル　大きなシステム依存度、韓国世論も影響 https://www.itmedia.co.jp/news/articles/2406/04/news171.html

LINEヤフーは個人情報流出を起こして、総務省から複数回行政指導を受けていますね。LINEは電話と同等と言っていいくらいインフラになっているので、韓国のNAVERに依存しているというのはセキュリティ上とても不安に感じます。

——————————–

【国内ニュース】 2024-06-04 18:26:08 JR東が「Suica」をスーパーアプリ化へ、28年度にリリース https://k-tai.watch.impress.co.jp/docs/news/1597366.html

上述の熊本市におけるSuica非対応の一方で、JR東としてはSuica経済圏を作りたいということのようです。もちろんSuicaは移動には使っていますが、買い物などの決済は最近はQRコード決済のことが多いです。JR東の資料を見てもQRコード決済に対してどう優位性をもたせるかはあまり書かれていないように見えて、どうなのかなあ…と思ってしまいました。

——————————–

【RAG】 2024-06-04 22:30:56 GNN-RAG: Graph Neural Retrieval for Large Language Model Reasoning https://arxiv.org/abs/2405.20139

【AIによる要約】

知識グラフ(KG)は、三つ組(ヘッド、関係、テール)の形式で表現された人工的な事実知識であり、それらが集まって1つのグラフを形成しています。知識グラフ上の質問応答(KGQA)は、自然言語の質問に対して知識グラフに含まれる情報に基づいて推論を行い、答えを見つける課題です。大言語モデル(LLM)は、自然言語の理解能力に優れているため、QAタスクにおいて最先端の性能を発揮しています。一方、グラフニューラルネットワーク(GNN)は、知識グラフに保持されている複雑なグラフ情報を扱うことができるため、KGQAによく用いられています。

本研究では、GNN-RAGと呼ばれる新しい手法を提案しています。これは、LLMの言語理解能力とGNNのグラフ推論能力を組み合わせたレトリバル拡張生成(Retrieval-Augmented Generation; RAG)スタイルのアプローチです。まず、GNNが知識グラフの密な部分グラフを推論して答候補を取り出します。次に、質問のエンティティと答候補を結ぶグラフ上の最短パスを抽出し、言語化して、LLMの入力とします。このGNN-RAGフレームワークでは、GNNが密な部分グラフの推論を担当し、LLMが自然言語処理能力を発揮して最終的な答えを生成します。さらに、レトリバル拡張(RA)という技術を開発し、GNN-RAGのKGQA性能をさらに向上させています。

実験の結果、GNN-RAGは、WebQSPとCWQの2つの有名なKGQAベンチマークにおいて最先端の性能を達成しており、7BチューニングされたチューニングLLMを使った場合、GPT-4の性能と同等かそれ以上の成果を示しています。特に、マルチホップやマルチエンティティの質問に対して優れた性能を発揮し、競合手法と比べて8.9~15.5ポイントF1スコアが高くなっています。

最近、大規模言語モデル(LLM)の活用ではRAGが注目されています。簡単にいうと、外部知識を与えてそれを参照して回答させる技術なのですが、正しく検索して回答を生成させるのはなかなか難しいようです。

この論文では、知識グラフを使って検索能力を高めるということのようですね。

2024/6/3のピックアップ

【開発技術】 2024-06-03 00:11:33 「パスキー」のユーザー体験を最適化させるデザインガイドライン、FIDOアライアンスが公開 https://www.publickey1.jp/blog/24/fido.html

パスキーは、従来のパスワードによるユーザー認証よりも強力で安全な認証方式とされており、普及が期待されていますが、多くのユーザーが慣れ親しんできたパスワード方式と比べると、サインアップやサインインの方法が分かりにくいという課題が指摘されていました。

FIDOアライアンスによるデザインガイドラインの公開は、こうした状況を改善するものとして期待されます。

——————————–

【技術解説】 2024-06-03 08:20:00 【西田宗千佳のイマトミライ】変わりゆくソニーと「ハードウェアの未来」 https://www.watch.impress.co.jp/docs/series/nishida/1596737.html

5月30日・31日の両日、ソニーグループは、投資家向けにグループ各社の事業状況を説明する「事業説明会 2024」を開催した。配信内容は以下のサイトで公開されており、自由に確認できる。https://www.sony.com/ja/SonyInfo/IR/library/presen/business_segment_meeting/

（中略）

今回は特に、エレクトロニクス(ソニーグループでは「エンタテインメント・テクノロジー&サービス分野」)と、イメージセンサーをはじめとした半導体(イメージング&センシング・ソリューション分野)から、将来のハードウェアについて考えてみよう。

イメージセンサーは強い。ソニーの主力になっているようです。わたしもソニーのミラーレス一眼をつかっていますがなかなか良いです。

テレビはどこも厳しいし、スマホも苦戦している。

——————————–

【新サービス】 2024-06-03 09:22:00 NVIDIA、難しいゲームでプレイをアシストしてくれるAI「Project G-Assist」 https://www.itmedia.co.jp/news/articles/2406/03/news075.html

米NVIDIAは6月2日（台湾時間）、COMPUTEX TAIPEIの開催に合わせ、PCゲームやアプリの操作を手助けするAIアシスタントのプロジェクト「Project G-Assist」を発表した。RTXの機械学習性能を活用し、ゲームやアプリの状況を認識して適切なアドバイスを行うというものだ。

最近のゲームは難しいから、アシストが必要なのでしょうか。でも自分で頑張らないと楽しくない気もします。

——————————–

【スキルアップ】 2024-06-03 10:17:34 CyberAgent AI事業本部新卒研修「MLOps」の資料を公開します | CyberAgent Developers Blog https://developers.cyberagent.co.jp/blog/archives/48203/

——————————–

【国内ニュース】 2024-06-03 13:48:00 MIXI、「AIチャットくん」開発ベンチャーを子会社化 https://www.itmedia.co.jp/news/articles/2406/03/news117.html

MIXIは、ChatGPTとLINE公式アカウントを使った対話型AIサービス「AIチャットくん」を運営するベンチャー企業のpicon（東京都渋谷区）の発行済み株式の一部を取得し、子会社化したと発表した。取得割合や価額は非公表。

AIチャットくん、わたしもつかったことありますが、出てくるのが早かったのと、LINEで使えるのでライト層にアプローチできたのではないでしょうか。とはいえ、ChatGPT公式のアプリも出ており、使いたい人はそちらに移行していて、新しもの好きの層はもう飽きちゃっているんじゃないかと思いますね。

——————————–

【新サービス】 2024-06-03 15:00:00 Introducing Perplexity Pages https://www.perplexity.ai/hub/blog/perplexity-pages

【AIによる要約】

Pagesは、情報の作成、整理、共有を簡単に行うことができます。任意のトピックを検索すると、構造が整った美しい書式の記事が即座に得られます。作成した作品をユーザー生成コンテンツのライブラリに公開し、1クリックで視聴者に直接共有することもできます。

Perplexity Pagesが他のツールと異なる点は以下の通りです:

– カスタマイズ性: 一般読者やテーマ専門家向けなど、ターゲット読者に合わせて記事の調子を調整できます。

– 柔軟性: 記事の構造を簡単に変更でき、セクションの追加、並べ替え、削除が可能です。

– 視覚性: Pagesによって生成された視覚素材や、ユーザーのコレクション、オンラインリソースを使って記事を視覚的に引き立てることができます。

Perplexity Pagesは、研究成果を視覚的に魅力的で包括的なコンテンツに簡単に変換できるツールです。記事、詳細なレポート、情報ガイドなどを作成する際に、Pages は作成プロセスを簡素化し、皆様Perplexityは検索に特化したAIです。新サービス「Page」を使うとweb記事の作成が容易にできるようで、便利そうです。

ChatGPTなどのChat系AIとは違う角度でサービスづくりをしていて目の付け所がいいと思っています。

——————————–

【因果推論】 2024-06-03 17:59:38 Integrating Large Language Models in Causal Discovery: A Statistical Causal Approach https://arxiv.org/abs/2402.01454

【AIによる要約】

本論文では、統計的因果発見(SCD)において、システマティックな背景知識の獲得に課題がある中で、ドメイン専門家の知識を制約として組み込むことの重要性について述べられています。

この課題を克服するために、本研究では、大規模言語モデル(LLM)を用いた知識ベースの因果推論(KBCI)と統計的因果発見(SCD)を統合するアプローチ、すなわち「統計的因果プロンプティング(SCP)」を提案しています。

具体的には、GPT-4を使ってLLM-KBCIの出力と事前知識を組み込んだSCDの結果を比較したところ、SCPを行うことでSCDの結果をさらに改善できることが示されました。また、未公開の実世界データセットを用いて、LLMが提供する背景知識がデータセットバイアスや限界を克服し、SCDの性能を向上させることも確認されました。

2024/6/2のピックアップ

【ニュース】 2024-06-02 01:48:18 4月に検出数が急増。意図せずインストールされる「PUA」とは？ https://ascii.jp/elem/000/004/201/4201013/

——————————–

【開発技術】 2024-06-02 06:14:49 「Android 15」強化されたUI採用 https://jetstream.blog/archives/186241

——————————–

【国内ニュース】 2024-06-02 10:02:09 【重要】SMARTalkサービス提供終了のお知らせ https://ip-phone-smart.jp/index.php?cID=708

2024/6/1のピックアップ

【スキルアップ】 2024-06-01 11:38:03 はじめてのアジャイル開発入門 | ドクセル https://www.docswell.com/s/papanda/ZJL3Q1-agile-hajimete?utm_source=twitter&utm_medium=social&utm_campaign=singlepage

——————————–

【その他】 2024-06-01 11:42:09 世界のキーボード入力事情調査～アラビア語編～ https://dailyportalz.jp/kiji/sekai-no-keyboard-arabic

——————————–

【その他】 2024-06-01 13:10:04 デロイト、グリコに加えユニ・チャームでもシステム障害…ベンダ能力に疑問も https://biz-journal.jp/company/post_381357.html

——————————–

【スキルアップ】 2024-06-01 15:15:56 生成AIで英作文添削　東進が日本マイクロソフトと連携して新講座「英作文1000本ノック」開講 https://univ-journal.jp/245055/

——————————–

【技術解説】 2024-06-01 15:24:06 最近の7B小型日本語LLMはエージェントになれるのか？ https://soysoftware.sakura.ne.jp/archives/3934

——————————–

【ニュース】 2024-06-01 17:10:00 「LUMIX S9」のストックフォト問題は何がいけなかったのか？ https://www.itmedia.co.jp/news/articles/2406/01/news060.html

——————————–

【その他】 2024-06-01 18:00:00 現役の海兵隊員が3500年前の「古代ギリシアの鎧」を着て伝説のトロイア戦争を再現、実戦向けの武具であることが実証される https://gigazine.net/news/20240601-ancient-mycenaean-armor-marines/