7, 8, 9月と続いているIT記事ピックアップですが、名前を「おもしろいIT・AI・科学記事一覧」から「テクノロジーニュースピックアップ!」に変更して10月も引き続きほぼ毎日更新していきます。
これまでは、毎日のニュースのタイトルと要約の引用を載せていましたが、見にくくなっていたと思うので、タイトル(リンク)だけにしようと思います。とくに気になるニュースや、タイトルだけでは意味がわかりにくいものについては、一部を引用したり、自分のコメントの中で説明するようにします。
ほぼ毎日ニュースチェックしてみて、最新のニュースについていけるようになったように思います。どんどん新しい技術が出てくる業界ですから、情報感度は高くしていきたいですね。
一週間ごと・一ヶ月ごとに用語のまとめも投稿するので、毎日見るのは大変…という方はそちらをチェックしてみて下さい。
【2023/10/23追記】
流石に毎日チェックして調べて更新するのが大変だったので、pythonスクリプトを書いて取得を自動化しました。その中から気になるものをピックアップするという形に変えます。
ちょっと見辛くなってしまいますが…
一週間のまとめでは気になる用語もまとめたいと思っています。
よろしくお願いします。
【2023/10/29追記】
ニュースピックアップの自動化についてブログを書きました。
feedparserライブラリを使って、RSS feedを自動抽出してみた(毎日のニュースチェックの自動化)
- 2023/10/31のピックアップ
- 2023/10/30のピックアップ
- 【一週間の記事のまとめ】2023/10/23~2023/10/29
- 2023/10/29のピックアップ
- 2023/10/27, 28のピックアップ
- 2023/10/26のピックアップ
- 2023/10/25のピックアップ
- 2023/10/24のピックアップ
- 2023/10/23のピックアップ
- 【一週間の用語のまとめ】2023/10/16~2023/10/22
- 2023/10/22のピックアップ
- 2023/10/21のピックアップ
- 2023/10/20のピックアップ
- 2023/10/19のピックアップ
- 2023/10/18のピックアップ
- 2023/10/17のピックアップ
- 2023/10/16のピックアップ
- 【一週間のまとめ】2023/10/9~2023/10/15
- 2023/10/15のピックアップ
- 2023/10/14のピックアップ
- 2023/10/13のピックアップ
- 2023/10/12のピックアップ
- 2023/10/11のピックアップ
- 2023/10/10のピックアップ
- 2023/10/9のピックアップ
- 【一週間のまとめ】2023/10/2~2023/10/8
- 2023/10/8のピックアップ
- 2023/10/7のピックアップ
- 2023/10/6のピックアップ
- 2023/10/5のピックアップ
- 2023/10/4のピックアップ
- 2023/10/3のピックアップ
- 2023/10/2のピックアップ
- 2023/10/1のピックアップ
2023/10/31のピックアップ
【AI・データ分析】 2023-10-31 “論文紹介【ICLR2023 notable top5%】その1 (随時更新)” https://qiita.com/sakai1250/items/845ffd65678c332f3be2
【AI・データ分析】【OpenAI】 2023-10-31 “New RelicのOpenAI ObservabilityでOpenAI APIの利用状況を可視化する” https://qiita.com/MarthaS/items/e0d3edaf9db8f91b8ed1
【AI・データ分析】 2023-10-31 決定木からlightGBMまで、なぜLightGBMが機械学習で最も広く使われているのかについて説明します https://qiita.com/xxyc/items/490e649a27c81aafeaae
【AI・データ分析】 2023-10-31 2023年版「データサイエンティストスキルチェックリスト」が無料公開 生成AIの利活用スキルなどを追加 https://www.itmedia.co.jp/news/articles/2310/31/news183.html
——————————
【Microsoft】 2023-10-31 “【これは欲しい】聞きたくない音を遮断し、聞きたい音だけ聞こえるノイキャン技術「Semantic Hearing」。ワシントン大とMicrosoftが開発” https://levtech.jp/media/article/column/detail_328/
——————————
【AWS】 2023-10-31 “AWSのセキュリティを学ぶためのコンテンツがまとめられた「AWS Ramp-Up Guide: Security, Identity and Compliance」を調べてみた” https://dev.classmethod.jp/articles/aws-ramp-up-guide-security-shirabetemita/
——————————
【ITの活用と未来】 2023-10-31 ドコモもスターリンク参入 23年内に提供開始 https://www.watch.impress.co.jp/docs/news/1543436.html
——————————
【Java】 2023-10-31 “Oracle CloudWorld 2023探訪記” https://qiita.com/tsunotkf/items/2589b267dd57bf2af6d5
——————————
【LLM】【生成AI】 2023-10-31 AI、ML、DL、生成AI、LLMの歴史と課題(記事作成中) https://qiita.com/mixtest/items/ed5ea67c1f207c5b7787
【LLM】【生成AI】 2023-10-30 従来の小さなニューラルネットワークでも「メタ学習」でChatGPTを凌駕するほど高度な生成AIができるとの報告、Nature誌 https://aiboom.net/archives/57838
【LLM】【生成AI】【LangChain】 2023-10-30 生成AIアプリ開発フレームワークLangChain入門 https://qiita.com/yoshiyuki_kono/items/88bba3363a17257c1158
【LLM】【生成AI】 2023-10-31 ソフトバンク、3500億パラメーターの国産LLM構築へ 「国内最大級」生成AI計算基盤、稼働スタート https://www.itmedia.co.jp/news/articles/2310/31/news169.html
——————————
【つくってみた】【Amazon】 2023-10-31 “Amazon BedrockとStreamlitでチャットボットを作成してみた” https://qiita.com/tatsuki-tsuchiyama/items/df1465a8c8fa8ac0a690
——————————
【その他】 2023-10-30 “エンジニアに読んで欲しい技術書90選 – Qiita” https://qiita.com/S4nTo/items/66f8339bfc6ad61b25b4
【その他】 2023-10-31 “リモートワークにおけるファシリテーションの方法論の増補版を公開します! – COPILOT KNOWLEDGE” https://blog.copilot.jp/entry/remote-facilitation-202310
【その他】 2023-10-31 【新連載】アウトプットこそ最高のインプット。鹿野壮が語る「自分が一番トクする」アウトプットの力 https://levtech.jp/media/article/column/detail_329/
【その他】 2023-10-31 日本オラクルのAI・クラウド教材が無料に 期間限定、1月まで https://www.itmedia.co.jp/news/articles/2310/31/news186.html
【その他】 2023-10-31 「育休取った話」と「仕事と子育ての両立」の話 https://dev.classmethod.jp/articles/an-childcare/
【その他】 2023-10-31 チーム間の調整テクニックのひとつ「ただ話す」 https://dev.classmethod.jp/articles/just-talk/
【その他】 2023-10-31 “自己流で英語に伸び悩んでいる人は『最新の第二言語習得研究に基づく 究極の英語学習法』を読むべし” https://dev.classmethod.jp/articles/book-review-learn-english-esl-research-way/
——————————
【ニュース】 2023-10-31 バイデン大統領がAIに関する大統領令を発令、AIを安全・安心・信頼できるものにするための法的規制が行われる https://gigazine.net/news/20231031-biden-ai-executive-order/
【ニュース】【Google】 2023-10-30 「Looker」が“政府認定クラウドサービス”に Google提供のBIツール https://www.itmedia.co.jp/news/articles/2310/30/news166.html
【ニュース】 2023-10-31 “画像生成AI「Stable Diffusion」や「Midjourney」に自作品の著作権を侵害されたとするアーティストたちの集団訴訟が裁判所によって棄却される” https://gigazine.net/news/20231031-stable-diffusion-midjourney-copyright-lawsuit/
2023/10/30のピックアップ
【AI・データ分析】 2023-10-30 “【拡散モデル初心者向け】実装例から学ぶデノイジングスコアマッチング: Pytorch使用” https://qiita.com/Keisuke_Hori/items/764b2c75a85a91f14a51
【AI・データ分析】 2023-10-30 Webページのデータを「Excel」に取り込むコネクターが刷新、AIで賢くテーブルを認識/人間がちょっと手助けするだけで従来は対応できなかったテーブルも抽出できる https://forest.watch.impress.co.jp/docs/news/1542648.html
——————————
【LLM】 2023-10-30 “Meta社のオープンソースコード世代 LLM Code Llama” https://www.infoq.com/jp/news/2023/10/meta-code-llama/?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global
【LLM】 2023-10-29 “Claude2で決算短信分析をしよう ~ChatGPTとの比較~” https://qiita.com/kaizinZ/items/b3271aa7791ec5e6917c
【LLM】 2023-10-29 “ローカル開発環境が使えない状況でのBedrock APIお試し” https://qiita.com/cyberBOSE/items/5efac74f1b4fa77b2e09
【LLM】 2023-10-30 わかりやすい英語で日本語の文法を説明するLLM「JPNsensei-V2」を公開しました。 https://qiita.com/xxyc/items/d1be5f96c0f10dcc0676
【LLM】【生成AI】【LangChain】 2023-10-30 生成AIアプリ開発フレームワークLangChain入門 https://qiita.com/yoshiyuki_kono/items/88bba3363a17257c1158
【LLM】 2023-10-30 IBIS2023チュートリアル「大規模言語モデル活用技術の最前線」 https://speakerdeck.com/1never/ibis2023tiyutoriaru-da-gui-mo-yan-yu-moderuhuo-yong-ji-shu-nozui-qian-xian
——————————
【Microsoft】 2023-10-30 “11月スタート「Microsoft 365 Copilot」の創造性 月30ドルの副操縦士” https://www.watch.impress.co.jp/docs/news/1542813.html
——————————
【Java】 2023-10-29 “Java 言語仕様・JVM仕様のバージョンごとの差分を見れるページを作りました。” https://qiita.com/YujiSoftware/items/d6fe6cc9296a345b7111
【Java】 2023-10-30 “Windows 11 への Java 21 のインストール” https://qiita.com/mmake/items/34425ec8605c84593295
——————————
【Python】 2023-10-30 そろそろ我々はsortedcontainersを使えるようになった方がいい https://qiita.com/Shirotsume/items/706742162db68c481c3c
【Python】 2023-10-30 pythonは_(アンダースコア)の使い方を理解するだけでプロフェッショナルになれる https://qiita.com/_Kohei_/items/069aa1e7b872f5ca96bf
——————————
【Mojo】 2023-10-30 Mojoプログラミング言語の特徴とは?将来性は?よく分かる入門資料まとめ https://freelance.levtech.jp/guide/detail/1643/
——————————
【その他】 2023-10-30 “サードパーティ Cookie の廃止に向けた準備 – Chrome for Developers” https://developer.chrome.com/ja/blog/cookie-countdown-2023oct/
【その他】 2023-10-30 「作ってから売る」と「売ってから作る」と「売れるようにしてから作る」 ~技術の社会実装のための『開発』~ https://speakerdeck.com/tumada/zuo-tutekaramai-ru-to-mai-tutekarazuo-ru-to-mai-reruyounisitekarazuo-ru
【その他】 2023-10-30 “なぜサイバーセキュリティ分野で人材が不足しており、職が埋まらないのか? – YAMDAS現更新履歴” https://yamdas.hatenablog.com/entry/20231030/cybersecurity-jobs-shortage
【その他】 2023-10-30 “「Real World HTTP」著者・渋川よしき氏が「最新情報は追わない」と断言する理由” https://levtech.jp/media/article/interview/detail_327/
【その他】 2023-10-30 「〇〇だから出来ない」おじさん対策と自分がそうならない方法 https://note.com/simplearchitect/n/n872f643e7a76
——————————
【科学】 2023-10-30 近畿大学がウナギの完全養殖に成功 https://www.watch.impress.co.jp/docs/news/1543129.html
——————————
【ニュース】 2023-10-30 あなたは大丈夫? LINEが利用できない「11月問題」迫る プライバシーポリシーへの同意が必須 https://www.itmedia.co.jp/news/articles/2310/30/news084.html
【ニュース】 2023-10-30 さよならVMware Broadcomによる買収完了で、企業としての存在に幕 VMwareブランドは引き続き残る https://www.itmedia.co.jp/news/articles/2310/30/news080.html
【一週間の記事のまとめ】2023/10/23~2023/10/29
用語のまとめをしたかったのですが、やっぱりちょっと大変なので、記事のピックアップにします。いずれ用語のまとめも自動化できたらいいなと思っています。
【LLM】 2023-10-25 LLMのプロンプト技術まとめ https://qiita.com/fuyu_quant/items/157086987bd1b4e52e80
【LLM】 2023-10-25 マルチモーダルモデル(LMM)の中身についてわかりやすく説明します https://qiita.com/xxyc/items/879fff638eb4b7acf65c
【LLM】 2023-10-25 “Stability AI、新たな日本語の大規模言語モデル 商用可能ライセンスで公開” https://www.watch.impress.co.jp/docs/news/1541911.html
【LLM】 2023-10-27 “StableDiffusion, LLMのGPUメモリ削減のあれこれ” https://qiita.com/nishiha/items/c1f31b4bd0a732a57985
【LLM】【Databricks】 2023-10-28 DatabricksにおけるLLMOps https://qiita.com/taka_yayoi/items/10106bdc8c39b0582d63
【LLM】【LangChain】 2023-10-29 LLMアプリ開発を体系的に学ぶには最適の入門書「ChatGPT/LangChainによるチャットシステム構築[実践]入門」 https://dev.classmethod.jp/articles/review-chatgpt-langchain-chatsystem/
【LLM】【Google】 2023-10-29 Googleから学ぶプロンプトエンジニアリングのTips集 https://qiita.com/Shisa_07/items/9bfea139389fdb61605e
【AI・データ分析】 2023-10-25 機械学習で一度40個以上のモデルをトレーニングできるライブラリ:lazypredict https://qiita.com/xxyc/items/0fda6e9f5798af41266c
【ITの活用と未来】2023-10-24 日本にも“社内GPT”の導入相次ぐ 日本マイクロソフトが語る最新動向 https://www.itmedia.co.jp/news/articles/2310/24/news144.html
【Mojo】 2023-10-23 高速なPython互換言語「Mojo」のMac版登場、Appleシリコンにネイティブ対応。Pythonの9万倍、C言語に比肩する高速性https://www.publickey1.jp/blog/23/pythonmojomacapplepython9c.html
【dbt】 2023-10-23 “dbtのカンファレンスイベント『Coalesce 2023』基調講演オンライン視聴レポート #dbtCoalesce #Coalesce23” https://dev.classmethod.jp/articles/report-dbt-coalecse-2023-keynote/
【Python】 2023-10-26 新卒向け「テストコード」の研修資料 Sansanが無料公開 Python上でのテスト方法を解説 https://www.itmedia.co.jp/news/articles/2310/26/news122.html
【その他】 2023-10-25 “「世界一流エンジニアの思考法」は強いエンジニアの習慣がいい感じに言語化されていてよかった件 – Lean Baseball” https://shinyorke.hatenablog.com/entry/how-world-class-engineers-think
2023/10/29のピックアップ
【AI・データ分析】 2023-10-28 “ShutterstockとAI技術: 新しい写真市場の革命” https://note.com/panda_lab/n/n87e91e8c7d6a
【AI・データ分析】 2023-10-28 “LenovoとNVIDIA、生成型AIの革命を牽引 – 新しいハイブリッドAIソリューションの発表” https://note.com/panda_lab/n/nb91629b65a09
【AI・データ分析】 2023-10-29 “各種Prompt Engineeringの日本語実例集(Zero-CoT、mock、ReAct、ToT、Metacog、Step Back、IEPなど)” https://qiita.com/YutaroOgawa2/items/aca32f8fd7d551596cf8
【AI・データ分析】 2023-10-29 ヤバいデータ分析(まだ途中すまんだけど現状でも役に立つと思うので) https://qiita.com/aokikenichi/items/9d829910efd5dff0b79f
——————————
【AWS】 2023-10-29 “[アップデート] Amazon AppStream 2.0のWindows環境においてマルチセッション構成が可能になりました” https://dev.classmethod.jp/articles/appstream-2-supports-multi-session-on-windows-fleet/
——————————
【dbt】 2023-10-29 “[新機能]MetricFlow統合後のdbt Semantic LayerをGoogleスプレッドシートから参照してみた” https://dev.classmethod.jp/articles/dbt-semantic-layer-refer-from-google-sheets/
【dbt】 2023-10-28 “[新機能]MetricFlow統合後のdbt Semantic LayerをTableau Desktopから参照してみた” https://dev.classmethod.jp/articles/dbt-semantic-layer-refer-from-tableau/
——————————
【Snowflake】 2023-10-29 “Tableau CloudからSnowflakeに接続してみた” https://dev.classmethod.jp/articles/tableau-cloud-snowflake/
【Python】【Snowflake】 2023-10-29 “Snowflake Pythonワークシートの出力(Output)に日本語を表示させる” https://qiita.com/changkuhu/items/bf5383abf712ea2b32e9
——————————
【ITの活用と未来】 2023-10-28 BEVスポーツカー大豊作 スポーツカー好きが歩く「モビリティショー2023」 https://www.watch.impress.co.jp/docs/topic/1542820.html
——————————
【LLM】【LangChain】 2023-10-29 LLMアプリ開発を体系的に学ぶには最適の入門書「ChatGPT/LangChainによるチャットシステム構築[実践]入門」 https://dev.classmethod.jp/articles/review-chatgpt-langchain-chatsystem/
【LLM】 2023-10-29 Copilotでやりやすいこと(ChatGPTと比較して) https://qiita.com/horiivalue/items/296ae85e424aa49e9790
【LLM】【Google】 2023-10-29 Googleから学ぶプロンプトエンジニアリングのTips集 https://qiita.com/Shisa_07/items/9bfea139389fdb61605e
2023/10/27, 28のピックアップ
【LLM】 2023-10-27 “StableDiffusion, LLMのGPUメモリ削減のあれこれ” https://qiita.com/nishiha/items/c1f31b4bd0a732a57985
【LLM】【Databricks】 2023-10-27 N番煎じでStockmark社のstockmark-13bをDatabricksで動かす https://qiita.com/isanakamishiro2/items/0966dd768932f1d59f91
【LLM】 2023-10-27 GPT-4などLLMのコード生成能力にデバッグ機能を追加する『SELF-DEBUGGING(セルフデバッギング)』と実行プロンプト https://aiboom.net/archives/57709
【LLM】【Databricks】 2023-10-28 DatabricksにおけるLLMOps https://qiita.com/taka_yayoi/items/10106bdc8c39b0582d63
【LLM】 2023-10-27 GPT-3.5-Turboをfine-tuningすることで、RAGを使った社内QAボットの処理を4倍以上高速化してみた https://dev.classmethod.jp/articles/speed-up-qa-bot-with-fine-tuning/
【LLM】 2023-10-27 「話し声と足音だけ抜き出して」など、複雑な言語指示で音を分離できるモデル 英国チームが開発 https://www.itmedia.co.jp/news/articles/2310/27/news122.html
——————————
【AI・データ分析】 2023-10-27 データサイエンスにおけるQA:AIプロジェクトのデータ準備にかかる時間を短縮する方法 https://qiita.com/Dataiku/items/7992c8b49194222b7fb8
【AI・データ分析】 2023-10-28 “雨粒の落下: 数値計算・機械学習・量子計算の3手法で運動方程式を解く” https://qiita.com/p-circle-kuh/items/150734aa1df616200adf
【AI・データ分析】 2023-10-27 生成AIにアーティストが反撃、汚染データでモデルを壊す新技術 https://www.technologyreview.jp/s/320556/this-new-data-poisoning-tool-lets-artists-fight-back-against-generative-ai/
——————————
【ITの活用と未来】 2023-10-27 生成AIでWebサイト制作を8週間→3週間に短縮 ベネッセ、業務効率化でコスト4割減に成功 https://www.itmedia.co.jp/news/articles/2310/27/news191.html
【ITの活用と未来】 2023-10-27 “生成AI時代に価値を創造する 「ソリューションデザイン」の現場” https://www.technologyreview.jp/s/318932/solution-design-creates-value-in-the-age-of-generative-ai/
——————————
【つくってみた】 2023-10-27 “OpenAI APIとPythonを使ってChatBOTをサクッと作りましょう!” https://qiita.com/sumiya113/items/3c16022c0beb3db19708
【つくってみた】 2023-10-28 獣害関連のデータをもっと登録しやすくなるようなWEBサービスをつくってみたよ https://qiita.com/tonytani37/items/d874d3defbcc70a19648
【つくってみた】 2023-10-28 Python実行終了時に音で知らせたい!(Jupyter-Beeperの使い方) https://qiita.com/d_sato_/items/cca4e008b57a854df74d
【つくってみた】 2023-10-27 “Amazon Connect + Lex + BedrockのAIチャットボットで、発話から個人情報(名前、住所、生年月日)を正しく認識できるか試してみた” https://dev.classmethod.jp/articles/amazon-connect-lex-bedrock-personal-information/
——————————
【dbt】 2023-10-27 “[新機能]VersionsやContractsでガバナンスを効かせつつ複数のdbt project間でModel参照が可能となる「dbt Mesh」を試してみた” https://dev.classmethod.jp/articles/dbt-mesh-try/
——————————
【科学技術】 2023-10-27 近大、ウナギの完全養殖に成功 大学初 https://www.itmedia.co.jp/news/articles/2310/27/news164.html
——————————
【OpenAI】 2023-10-27 OpenAI、AIの“壊滅的な”リスクに取り組む「Preparedness」チーム結成 https://www.itmedia.co.jp/news/articles/2310/27/news119.html
——————————
【ニュース】 2023-10-28 「嗅いでいる匂い」が色の知覚にまで影響を及ぼす可能性があると実験で判明 https://gigazine.net/news/20231028-smell-change-perceive-color/
【ニュース】 2023-10-27 ボストン・ダイナミクスがChatGPTを使って自社のロボット犬を「話す犬」に変える https://gigazine.net/news/20231027-boston-dynamics-spot-talking-with-chatgpt/
——————————
【speakdeck】 2023-10-27 “業務で使える一歩進んだPython使いになるために / To become an advanced user of Python that can be used at work” https://speakerdeck.com/yumechi/to-become-an-advanced-user-of-python-that-can-be-used-at-work
——————————
【その他】 2023-10-27 “「Microsoft Teams」の自動化機能がリニューアル ~テンプレートの拡充やAI機能も/「Power Automate」を「Workflow」に統合してわかりやすく” https://forest.watch.impress.co.jp/docs/news/1542605.html
2023/10/26のピックアップ
【LLM】 2023-10-26 “青空文庫のテキストから作成したコーパスを HuggingFace で公開しました” https://qiita.com/akeyhero/items/b53eae1c0bc4d54e321f
【LLM】 2023-10-26 LLMに非線形的な思考を与えてCoTを上回る性能を引き出す手法『IEP』と実行プロンプト CoTと組合せでさらに強力になる場合も https://aiboom.net/archives/57628
【LLM】 2023-10-26 “大規模言語モデルのFine-tuningによるドメイン知識獲得の検討 – Preferred Networks Research & Development” https://tech.preferred.jp/ja/blog/llm-fine-tuning-for-domain-knowledge/
——————————
【AI・データ分析】 2023-10-26 vision-languageのタスクの紹介 https://qiita.com/minh33/items/350142f21109c17a35b3
——————————
【ITの活用と未来】 2023-10-26 “Apple Watchが新操作「ダブルタップのジェスチャー」対応 watchOS 10.1” https://www.watch.impress.co.jp/docs/news/1542161.html
——————————
【OpenAI】 2023-10-26 進化したChatGPT 画像認識・生成可能になったGPT-4Vが凄い https://www.watch.impress.co.jp/docs/topic/1541737.html
【OpenAI】 2023-10-26 “LangChainでLlama Indexを使う” https://qiita.com/tamyu/items/d4018572bfa7fb9d4393
【OpenAI】 2023-10-26 社内FAQ生成AIチャットボットをローコードで作ってみて分かったメリットと社内導入で気を付けるべき6つのポイント【UiPath】 https://qiita.com/ManabuTech/items/425d1625d6585eca5a34
——————————
【Python】 2023-10-26 Python3エンジニア認定基礎試験合格体験記 https://qiita.com/restructure/items/5430ac9aa560f1a5302e
【Python】 2023-10-26 PythonでWord文書を管理する:コメントの追加、削除、返信 https://qiita.com/iceblue/items/02c471649b897246e472
【Python】 2023-10-26 新卒向け「テストコード」の研修資料 Sansanが無料公開 Python上でのテスト方法を解説 https://www.itmedia.co.jp/news/articles/2310/26/news122.html
——————————
【開発技術】 2023-10-26 “JavaScriptビルドツールの整理 各ツールの機能と依存関係” https://zenn.dev/nakaakist/articles/86457bf2908379
——————————
【Amazon】 2023-10-26 mixpanelとGoogleスプレッドシートを連携してみる https://dev.classmethod.jp/articles/mixpanel-google_sheets/
【Amazon】 2023-10-26 アウトプットを3段階に分類してステップアップしよう https://dev.classmethod.jp/articles/recognize-three-steps-of-outputs/
【Amazon】 2023-10-26 “AWS Certified Machine Learning – Specialty(MLS)に合格できたので振り返る” https://dev.classmethod.jp/articles/mls-wada/
【Amazon】 2023-10-26 “AWS が公開している AWS Control Tower の学習コンテンツをまとめてみた” https://dev.classmethod.jp/articles/aws-control-tower-learning-resources/
——————————
【ニュース】 2023-10-25 NASAが190億km離れたボイジャー2号に18時間かけてソフトウェア更新用パッチを送信 https://gigazine.net/news/20231025-nasa-voyager-software-patch/
【ニュース】 2023-10-26 「言語を一般化する人間のような能力を持つニューラルネットワーク」の登場によりAIに革新が起こる可能性 https://gigazine.net/news/20231026-ai-breakthrough-neural-network/
【ニュース】 2023-10-26 NASAが小惑星ベンヌから持ち帰ったサンプルの多くは「フタが開かない」せいで取り出せない状態になっている https://gigazine.net/news/20231026-nasa-bennu-asteroid-sample-locked-out/
【ニュース】 2023-10-26 「腕に巻き付けられるスマートフォン」のコンセプトをMotorolaが公開 https://gigazine.net/news/20231026-motorola-adaptive-display-devices/
【ニュース】 2023-10-26 無料で利用できるオープンソースの世界地図フォーマット「Protomaps」 https://gigazine.net/news/20231026-protomaps/
【ニュース】 2023-10-26 異次元の超高感度「ISO100万」──キヤノンが世界で初めて製品化した「SPADセンサー」搭載カメラを見てきた https://www.itmedia.co.jp/news/articles/2310/25/news170.html
【ニュース】 2023-10-26 「マイナビ」で応募者の個人情報漏えい 別の企業の応募者データ取得できる状態、1年半にわたり https://www.itmedia.co.jp/news/articles/2310/26/news097.html
——————————
【科学技術】 2023-10-26 「CAPTCHA」の終わりの始まり https://www.technologyreview.jp/s/320633/death-to-captchas/
【科学技術】 2023-10-26 理研、室温作動のH–導電性固体電解質を開発 https://www.technologyreview.jp/n/2023/10/26/320579/
【科学技術】 2023-10-26 アトピー性皮膚炎の個別化医療へ前進、遺伝子発現パターンを解明 https://www.technologyreview.jp/n/2023/10/26/320718/
【科学技術】 2023-10-26 「日本の研究はもはやワールドクラスではない」と科学誌のNatureが指摘 https://gigazine.net/news/20231026-japanese-research-no-longer-world-class/
——————————
【その他】 2023-10-26 “サーバー構築の練習ができる学習サイトInfraAcademy – Qiita” https://qiita.com/ryu235464345/items/54b29c56dd118d8ae4a0
【その他】 2023-10-26 “Google Apps Script は、もはやエンジニアが書かない方がいいまである” https://zenn.dev/lovegraph/articles/01d9a83d4da8fd
【その他】 2023-10-26 ドキュメント執筆にもGit、ビルド、テストで再利用性や整合性を実現する「Writerside」、JetBrainsがプレビューリリース https://www.publickey1.jp/blog/23/gitwritersidejetbrains.html
【その他】 2023-10-26 iPhone全モデルと2020年以降のMacからパスワードやメールを盗み出す「iLeakage」が報告される、実際に動作するデモ映像もあり https://gigazine.net/news/20231026-ileakage-iphone-ipad-mac/
【その他】 2023-10-26 ITエンジニアのフルリモートに憧れる人が多いと思うが経験すると結構なデメリットがあった「対面以上のコミュニケーションが必要」 https://togetter.com/li/2247213
【その他】 2023-10-26 ““Oryon”(オライオン)はWindows PCの世界にインパクトを与えられるか” https://www.itmedia.co.jp/pcuser/articles/2310/26/news110.html
2023/10/25のピックアップ
【LLM】 2023-10-25 “N番煎じでStability.aiのJapanese Stable LM Instruct Gamma 7BをDatabricksで動かす” https://qiita.com/isanakamishiro2/items/fa1e874278e3a02fea52
【LLM】 2023-10-25 LLMのプロンプト技術まとめ https://qiita.com/fuyu_quant/items/157086987bd1b4e52e80
【LLM】 2023-10-25 マルチモーダルモデル(LMM)の中身についてわかりやすく説明します https://qiita.com/xxyc/items/879fff638eb4b7acf65c
【LLM】 2023-10-25 Natureなどの論文約4,800本でGPT-4による査読能力が検証され、「LLMは査読にも有用」と結論 https://aiboom.net/archives/57449
【LLM】 2023-10-25 “Stability AI、新たな日本語の大規模言語モデル 商用可能ライセンスで公開” https://www.watch.impress.co.jp/docs/news/1541911.html
——————————
【AI・データ分析】 2023-10-24 “人とロボットの共生: FAIRの最新シミュレータと3Dデータセットの革命” https://note.com/panda_lab/n/ne943307ba6d6
【AI・データ分析】 2023-10-25 “Visual Studio用Teamsツールキット:自動化されたライフサイクルと統合ボットデバッグ” https://www.infoq.com/jp/news/2023/10/visual-studio-teams-toolkit/?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global
【AI・データ分析】 2023-10-25 機械学習で一度40個以上のモデルをトレーニングできるライブラリ:lazypredict https://qiita.com/xxyc/items/0fda6e9f5798af41266c
【AI・データ分析】 2023-10-25 “CVPR2023の枝刈り論文 (2)” https://qiita.com/kyad/items/0d004fa6846f207d09ca
【AI・データ分析】 2023-10-25 プロンプトが苦手な人でも便利に使える言語生成AI「GATE」 米MITが開発 https://www.itmedia.co.jp/news/articles/2310/25/news041.html
【AI・データ分析】 2023-10-25 “畳み込みニューラルネットワークの処理についてアニメーションで解説する「Animated AI」” https://gigazine.net/news/20231025-animated-ai/
——————————
【ITの活用と未来】 2023-10-25 “モビリティの未来を観る「Tokyo Future Tour」【モビリティショー】” https://www.watch.impress.co.jp/docs/news/1542064.html
【ITの活用と未来】 2023-10-25 Yahoo!ニュース、コメントのAI要約開始 GPT-4採用 https://www.watch.impress.co.jp/docs/news/1541855.html
【ITの活用と未来】 2023-10-25 カリフォルニア州がCruiseの自動運転車両配備と無人運転試験の許可を即時停止 https://gigazine.net/news/20231025-dmv-immediate-suspension-of-cruise/
【ITの活用と未来】 2023-10-25 「自動運転は人間のドライバーより圧倒的に事故率が低い」とGM傘下のCruiseが主張、事故件数は65%減&ケガのリスクを伴う事故も74%減 https://gigazine.net/news/20231025-autonomous-vehicle-human-driver-crash-rate/
——————————
【Python】 2023-10-25 新言語「Mojo🔥」に触れてみた https://qiita.com/0_terarin_0/items/5945e1fee9cae059ffbc
——————————
【Amazon】 2023-10-24 “開発寄りのエンジニアがテストを体系的に学ぶためにJSTQBのFoundation Levelを受験してみました” https://dev.classmethod.jp/articles/jstqb-fl-exam/
【Amazon】 2023-10-25 “Alteryx の Pythonツールを使って PDFファイルからテキストを抽出してみた ~超シンプルファイル編~” https://dev.classmethod.jp/articles/alteryx-python-extract-text/ https://dev.classmethod.jp/articles/aws-managed-policy-is-deprecating-cloudwatchfullaccess/
【Amazon】 2023-10-25 “Slack Canvasに解説等記述したい時向けの個人的HowToをまとめてみた” https://dev.classmethod.jp/articles/how-to-write-notes-on-slack-canvas/
【Amazon】 2023-10-25 “AWS Configコスト上昇の原因を調査:QuickSight + Athenaの分析ツールを活用 – Uzabase for Engineers” https://tech.uzabase.com/entry/2023/10/25/153127
——————————
【Google】 2023-10-25 Googleの親会社「Alphabet」が2023年度第3四半期決算を発表、売上高は前年比11%増でYouTubeも好調だがクラウド部門は予想を下回る https://gigazine.net/news/20231025-alphabet-2023q3/
【Google】 2023-10-24 “Webアプリ版Photoshopを実現させた最新Web技術をGoogleが紹介。WebAssemblyのスレッドによる高速化、ストリーミングコンパイル、Web Componentsなど” https://www.publickey1.jp/blog/23/webphotoshopwebgooglewebassemblyweb_components.html
——————————
【Microsoft】 2023-10-25 Microsoft、AI搭載クラウド好調で2桁台の増収増益 https://www.itmedia.co.jp/news/articles/2310/25/news080.html
【Microsoft】2023-10-25 「前歯を舌でタップ」「舌をかむ」 VRヘッドセットを“舌操作” 米Microsoftが開発 https://www.itmedia.co.jp/news/articles/2310/25/news042.html
——————————
【OpenAI】【Microsoft】 2023-10-25 “世界一わかりみの深いAzure OpenAI Service | SIOS Tech. Lab” https://tech-lab.sios.jp/archives/36497
——————————
【Databricks】 2023-10-25 “Databricks Assitant にて指定したディレクトリの Databricks のノートブック一覧を取得する関数を生成” https://qiita.com/manabian/items/6b7415f16ac7247310bf
——————————
【Java】 2023-10-24 Javaプロセスをリストアップする https://qiita.com/sato_ken09/items/ef7f283b390312bfe3ae
【Java】 2023-10-25 “NewRelic java agent の JAR 管理を Gradle に任せる” https://qiita.com/takeyoda/items/21a0d19c1ddc6aa6355d
【Java】 2023-10-25 javaのentityクラス、modelクラス、dtoクラスの使い分け https://qiita.com/pe-pe-desu/items/c9c3688aa5367791d30e
——————————
【ニュース】 2023-10-25 火山灰に埋もれて炭化した古代ローマの巻物を解読したら3000万円がゲットできるチャレンジで最初の単語がついに解読される https://gigazine.net/news/20231025-vesuvius-challenge-first-word/
【ニュース】 2023-10-25 「InstagramやFacebookは子どものメンタルヘルスに害を与える」として42人の司法長官がMetaを訴える https://gigazine.net/news/20231025-meta-lawsuit-facebook-instagram-children-mental-health/
【ニュース】 2023-10-25 「株式会社GYAO」消滅へ https://www.itmedia.co.jp/news/articles/2310/25/news135.html
【ニュース】 2023-10-25 生成AIの「フェイク画像」も見分けられる? 「コンテンツクレデンシャル」を実際に試して見えた“死角” https://www.itmedia.co.jp/news/articles/2310/25/news107.html
——————————
【speakdeck】 2023-10-24 “情報収集を効率化する自然言語処理の活用方法 〜PythonではじめるAwesomeリポジトリの作り方〜 / pycon-apac-2023” https://speakerdeck.com/taishii/pycon-apac-2023 —————————— 【
科学技術】 2023-10-24 「JT-60SA」が初プラズマに成功 核融合実験 https://www.itmedia.co.jp/news/articles/2310/24/news177.html
【科学技術】 2023-10-25 CO2をほぼすべてCOに変換できる光触媒反応=筑波大 https://www.technologyreview.jp/n/2023/10/25/320580/
——————————
【開発技術】 2023-10-24 “Webアプリケーションのパフォーマンス・チューニングの勘所 / web tuningperformance” https://speakerdeck.com/soudai/web-tuningperformance
——————————
【その他】 2023-10-24 “育児支援ダッシュボードを支える技術 – 人間だったら考えて” https://www.szdrblog.info/entry/2023/10/24/184638
【その他】 2023-10-25 “「世界一流エンジニアの思考法」は強いエンジニアの習慣がいい感じに言語化されていてよかった件 – Lean Baseball” https://shinyorke.hatenablog.com/entry/how-world-class-engineers-think
【その他】 2023-10-25 東大、これまでに解かれたことのない次元の暗号解読を実現 https://pc.watch.impress.co.jp/docs/news/1541846.html
【その他】 2023-10-25 知らない番号に間違えて出たら、義妹そっくりの声で詐欺電話がかかってきた→留守電からAIで似せた声を作ってるらしい https://togetter.com/li/2247073
【その他】 2023-10-25 “生成AIグラビアをグラビアカメラマンが作るとどうなる?第11回:Stable Diffusion 1.5の注目ModelやLoRAを紹介+α版 (西川和久) | テクノエッジ TechnoEdge” https://www.techno-edge.net/article/2023/10/25/2138.html
【その他】 2023-10-25 CPUもGPUもライバル完封。Qualcomm、AppleやIntelに勝利宣言 https://pc.watch.impress.co.jp/docs/news/1541796.html
【その他】 2023-10-25 LINEヤフー株式会社が目指すエンジニア組織のビジョンとDevRelの役割 https://speakerdeck.com/lycorptech_jp/the-role-of-devrel-at-ly-corporation
2023/10/24のピックアップ
【LLM】 2023-10-24 “DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか?OpenAIが論文で発表” https://aiboom.net/archives/57310
——————————
【AI・データ分析】 2023-10-24 マイクロソフト、IP侵害の懸念に対しCopilot著作権コミットメントを発表 https://www.infoq.com/jp/news/2023/10/copilot-copyright-commitment/?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global
【AI・データ分析】 2023-10-24 “Kubernetes 1.28がリリースされ、新しいリポジトリとWindowsにおける権限の昇格が修正” https://www.infoq.com/jp/news/2023/10/kubernetes-1-28/?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global
【AI・データ分析】 2023-10-24 映像内で動く人や背景を好きなように置き換えられる技術「DynVideo-E」。シンガポールの研究者らが開発【研究紹介】 https://levtech.jp/media/article/column/detail_324/
——————————
【ITの活用と未来】 2023-10-23 大阪万博の電子マネー「ミャクペ!」来春開始 普段から使える https://www.watch.impress.co.jp/docs/news/1541396.html
【ITの活用と未来】 2023-10-24 KDDIメタバース「αU」本格始動 無印やカラオケ追加、バーチャル渋谷ハロウィンも https://www.watch.impress.co.jp/docs/news/1541660.html
【ITの活用と未来】 2023-10-23 “総合運用管理ソフトウェア「Hinemos」における生成AIを用いた運用自動化・効率化の実証実験を開始 | NTTデータ先端技術株式会社” https://www.intellilink.co.jp/topics/news_release/2023/102300.aspx
【ITの活用と未来】2023-10-24 日本にも“社内GPT”の導入相次ぐ 日本マイクロソフトが語る最新動向 https://www.itmedia.co.jp/news/articles/2310/24/news144.html
——————————
【Python】 2023-10-24 無料数理最適化ソルバーOR-Toolsのインストールから簡単な問題を解くまで https://qiita.com/KairiGold/items/f403403f3be8d31db2c3
——————————
【Amazon】 2023-10-23 “最新 Intel CPUを搭載した メモリ最適化(R7i)とCPU最適化(C7i) インスタンスがリリースされていました” https://dev.classmethod.jp/articles/c7i-r7i-new-ec2-instances/
【Amazon】 2023-10-23 “Contentfulのフラッグシップイベント、Storylines 2023 @ベルリンに参加してきた!” https://dev.classmethod.jp/articles/contentful-storylines-2023-berlin/
【Amazon】 2023-10-23 “短期間でコンタクトセンター環境を提供する「スタートパッケージ for Amazon Connect」をリリースしました” https://dev.classmethod.jp/articles/release-start-package-for-amazon-connect/
【Amazon】 2023-10-24 “[アップデート] Amazon QuickSight に Starburst 向けのデータソースコネクターが追加されたので、Starburst Galaxy と接続してみた” https://dev.classmethod.jp/articles/quicksight-direct-connectivity-starburst/
——————————
【Apple】 2023-10-24 Appleは2年で7500億円を投資してAI開発競争に追いつくことを計画している https://gigazine.net/news/20231024-apple-ai-server-purchases-5-billion-two-years/
——————————
【dbt】 2023-10-23 “dbtのカンファレンスイベント『Coalesce 2023』基調講演オンライン視聴レポート #dbtCoalesce #Coalesce23” https://dev.classmethod.jp/articles/report-dbt-coalecse-2023-keynote/
——————————
【Mojo】 2023-10-24 新しいPython風プログラミング言語Mojoを試してみた https://dev.classmethod.jp/articles/try-mojo-programming-langurage/
——————————
【Java】 2023-10-24 “AWS EC2のAmazon Linuxに複数のJavaをインストールして切り替える方法” https://qiita.com/fd-fujisawa/items/57942b0cd91c68cafb3a
——————————
【ニュース】 2023-10-24 イラスト作品や写真作品を毒化して画像生成AIの学習を阻害できる学習防止ツール「Nightshade」 https://gigazine.net/news/20231024-nightshade-poison-image-generate-ai-model/
【ニュース】 2023-10-24 顔認識検索エンジン「PimEyes」は子どもの顔の検索をブロックしている https://gigazine.net/news/20231024-facial-recognition-service-blocks-searches-for-childrens-faces/
【ニュース】 2023-10-24 “Qualcommの次期フラグシップSoC「Snapdragon 8 Gen 3」は生成AI性能が重視されている可能性” https://gigazine.net/news/20231024-qualcomm-snapdragon-8-gen-3-leaked/
【ニュース】 2023-10-24 世界最大のプレプリントサーバー「arXiv」に約15億円もの資金が提供される、クラウド移行やコードの近代化に使われる計画 https://gigazine.net/news/20231024-research-repository-arxiv-receives-10m-funding/
【ニュース】 2023-10-24 あの三省堂から、オタク用語辞典「大限界」登場 今の若者が使う1600用語を収録 https://www.itmedia.co.jp/news/articles/2310/24/news136.html
【ニュース】 2023-10-24 Excelの自動データ変換で「日付に変換」の無効化が可能に 遺伝学者の声届く https://www.itmedia.co.jp/news/articles/2310/24/news091.html
【ニュース】 2023-10-24 スマートホーム規格「Matter」が「1.2」に ロボット掃除機やエアコンをサポート https://www.itmedia.co.jp/news/articles/2310/24/news079.html
——————————
【speakdeck】 2023-10-24 “決定版!?OSSアプリプロジェクトでのBeta版アプリ配布の方法「Xcode Cloud + TestFlight」” https://speakerdeck.com/ryitto/jue-ding-ban-ossapuripuroziekutodenobetaban-apuripei-bu-nofang-fa-xcode-cloud-plus-testflight
——————————
【科学技術】 2023-10-24 次世代暗号の解読コンテストで世界記録、ポスト量子暗号へ=東大 https://www.technologyreview.jp/n/2023/10/24/320543/
【科学技術】 2023-10-24 月はこれまで考えられていたより約4000万年古いことがアポロ17号が持ち帰ったジルコン結晶から判明 https://gigazine.net/news/20231024-moon-millions-of-years-older-apollo-crystals/
——————————
【その他】 2023-10-23 あー、やっぱりか。ここんとこずっとVR機を使ってて、薄っすら感じてて違和感を覚えていたことが実際あるんだ、と⇒「どう考えても、視力が回復してるんだよな」 https://togetter.com/li/2246113
【その他】 2023-10-24 エンジニアを目指す君たちはどう生きるか ~ソフトウェアアーキテクトのすゝめ~ https://speakerdeck.com/rhumie/enziniawomu-zhi-sujun-tatihadousheng-kiruka
【その他】 2023-10-24 パスキーとは–パスワードに代わる認証方法の基礎 https://japan.zdnet.com/article/35210479/
【その他】 2023-10-24 “MisskeyのUI設計 | gihyo.jp” https://gihyo.jp/article/2023/10/misskey-07
【その他】 2023-10-24 オブジェクト指向の複雑性を軽減する、データ指向プログラミング入門 https://zenn.dev/chillnn_tech/articles/e78a76f94ad45a
【その他】 2023-10-24 Excelの自動データ変換で「日付に変換」の無効化が可能に 遺伝学者の声届く https://www.itmedia.co.jp/news/articles/2310/24/news091.html
【その他】 2023-10-24 Amazon、WebとiOSで「パスキー(passkey)」サポート Androidも間もなく https://www.itmedia.co.jp/news/articles/2310/24/news082.html
【その他】 2023-10-24 “「Raspberry Pi 5」販売開始。日本発売はもう少しかかりそう” https://pc.watch.impress.co.jp/docs/news/1541481.html
2023/10/23のピックアップ
【LLM】 2023-10-22 LLMと遺伝的アルゴリズムを使用して、個性によって社会集団の行動がどのように変化していくのかを観察する挑戦的な研究が行われました。 https://aiboom.net/archives/57195
【LLM】 2023-10-23 MegatronLMを解説 https://qiita.com/harapeko_jiro/items/cbb116067b54f048b73a
【LLM】 2023-10-23 LangChainのToolsとESP8266をWi-Fi接続してLチカしてみた https://qiita.com/umaxiaotian/items/4f0a688ab4a2b8db477c
【LLM】 2023-10-23 Kaggle初めてのLLMコンペに参加しました https://qiita.com/xxyc/items/154250c01a98aed66944
【LLM】 2023-10-23 LLMにベートーヴェンなど特定の人物の行動や感情を模倣させる、イタコのような技術『Character-LLM(キャラクターLLM)』 https://aiboom.net/archives/57223
——————————
【AI・データ分析】 2023-10-23 Pythonでの開発効率化のための手探り https://qiita.com/vipper36/items/5cb2fb825fbaa7e8e49b
——————————
【ITの活用と未来】 2023-10-23 【西田宗千佳のイマトミライ】NTTと通信事業者が衝突。「NTT法見直し」はどうなるのか https://www.watch.impress.co.jp/docs/series/nishida/1541060.html
——————————
【Python】 2023-10-23 “【Django】FlatPageのNo FlatPage matches the given queryを解決する” https://qiita.com/NOIZE/items/f4446125f494907bbf5f
【Python】 2023-10-23 【バンドマン向け】pythonを使って音源をサンプリングする方法 https://qiita.com/iwatsukiyota/items/45f0bbcdec9d176e608f
——————————
【Amazon】 2023-10-23 “Microsoft Entra Permissions Management で AWS IAM Identity Center 構成機能を使ってみた” https://dev.classmethod.jp/articles/entra-permissions-management-identity-center-user/
【Amazon】 2023-10-23 “ブログ執筆時に GitHub Copilot を使って効率化していること3選” https://dev.classmethod.jp/articles/how-github-copilot-is-helping-me-write-blog-posts-more-efficiently-3-examples/
——————————
【Java】 2023-10-23 “スッキリわかるJava入門 実践編 第3版 まとめ -part17-ユーザーインターフェース制御” https://qiita.com/da2_panda/items/5598b77dfe6b3efd6cc0
【Java】 2023-10-23 “スッキリわかるJava入門 実践編 第3版 まとめ -part16-スレッドによる並列処理” https://qiita.com/da2_panda/items/3db22ef5a273ed48f9e7
——————————
【dbt】 2023-10-23 “dbtのカンファレンスイベント『Coalesce 2023』基調講演オンライン視聴レポート #dbtCoalesce #Coalesce23” https://dev.classmethod.jp/articles/report-dbt-coalecse-2023-keynote/
——————————
【ニュース】 2023-10-22 “NVIDIAのドライバアップデートでStable Diffusionが2倍高速化” https://gigazine.net/news/20231022-nvidia-boosts-stable-diffusion-performance/
【ニュース】 2023-10-23 楽天モバイル、初の「プラチナバンド」獲得 2024年中のサービス開始目指す https://www.itmedia.co.jp/news/articles/2310/23/news149.html
【ニュース】 2023-10-23 NTT西系の情報流出 指摘後社内調査3カ月も「漏えいない」 委託元の指摘見逃し検証へ https://www.itmedia.co.jp/news/articles/2310/23/news100.html
【ニュース】 2023-10-23 レーザービームを放ち、1km間を9Gbpsで無線通信する携帯型システム 中国の研究者らが開発 https://www.itmedia.co.jp/news/articles/2310/23/news034.html
【ニュース】 2023-10-23 複数のAIが話し合ってアプリを作るフレームワーク 米Microsoftなどの研究者らが開発 https://www.itmedia.co.jp/news/articles/2310/23/news033.html
——————————
【speakdeck】 2023-10-22 LTのススメ https://speakerdeck.com/ruitomo/ltnosusume 【speakdeck】 2023-10-23 並行キャッシュライブラリーの開発で得られた知見 https://speakerdeck.com/tatsuya6502/bing-xing-kiyatusiyuraiburarinokai-fa-dede-raretazhi-jian
【speakdeck】 2023-10-23 three.jsとRapierでレースゲームが3日でできた話 https://speakerdeck.com/yomotsu/three-dot-jstorapierderesugemuga3ri-dedekitahua
——————————
【科学技術】 2023-10-23 炎症性腸疾患を早期発見、大腸菌入りの「飲む」センサー https://www.technologyreview.jp/s/320110/this-microbe-filled-pill-could-track-inflammation-in-the-gut/
【科学技術】 2023-10-23 気候テック15:あらゆる食品を植物由来原料で再現するノットコ https://www.technologyreview.jp/s/318852/2023-climate-tech-companies-to-watch-notco-and-its-plant-based-foods/
【科学技術】 2023-10-23 “波紋広げた研究論文、 トランスジェンダー伝染説は いかにして利用されたか” https://www.technologyreview.jp/s/285249/how-the-idea-of-a-transgender-contagion-went-viral-and-caused-untold-harm/
——————————
【その他】 2023-10-23 “キャッチアップ速度が速い #とは” https://speakerdeck.com/nrryuya/kiyatutiatuhusu-du-kasu-i-number-toha
【その他】 2023-10-23 “構成図を描く際に気をつけていること – NRIネットコムBlog” https://tech.nri-net.com/entry/keep_in_mind_configuration_diagram
【その他】 2023-10-23 “情報処理技術者試験の答案を開示請求した話 – Qiita” https://qiita.com/kmatsubara/items/9e70c136725fab747165
【その他】 2023-10-23 複数のAIが話し合ってアプリを作るフレームワーク 米Microsoftなどの研究者らが開発 https://www.itmedia.co.jp/news/articles/2310/23/news033.html
【その他】 2023-10-23 “DDDやってみたら 実装以前の領域での学びが深かった話” https://speakerdeck.com/kumagoro95/dddyatutemitenoxue-biqi-duki
【その他】 2023-10-23 高速なPython互換言語「Mojo」のMac版登場、Appleシリコンにネイティブ対応。Pythonの9万倍、C言語に比肩する高速性 https://www.publickey1.jp/blog/23/pythonmojomacapplepython9c.html
【その他】 2023-10-23 “State of DevOps Report 2023 のまとめ” https://zenn.dev/cybozu_ept/articles/c0ad1f13cb8d72
【その他】 2023-10-23 Google、イーサネットをさらに高速にするハードウェア支援型の新トランスポート技術「Falcon」を公開 https://www.publickey1.jp/blog/23/googlefalcon.html
【その他】 2023-10-23 “生成AI 日本での認証制度づくりに企業が新たな業界団体設立へ | NHK” https://www3.nhk.or.jp/news/html/20231023/k10014233641000.html
【その他】 2023-10-23 “フリーランスエンジニアの成長戦略とスキルアップの方法を紹介 – みんなのシステム企画” https://ripurun.com/media/engineer/freelance-skill/
【その他】 2023-10-23 NTTと通信事業者が衝突。「NTT法見直し」はどうなるのか【西田宗千佳のイマトミライ】 https://www.watch.impress.co.jp/docs/series/nishida/1541060.html https://news.yahoo.co.jp/expert/articles/0c559fd849b60eca255f84ca7ba64c58b17d9e91
【その他】 2023-10-23 アニメ系イラストに特化した生成AI「にじジャーニー」のスマホアプリ「niji・journey」が正式公開されたので使ってみた https://gigazine.net/news/20231023-niji-journey-mobile-app/
【一週間の用語のまとめ】2023/10/16~2023/10/22
記事ピックアップ
2023/10/20 Java 21の概要 / outline of Java 21
2023/10/21 Import を変更するだけで高速化!? Pandas 互換ライブラリ FireDucks を検証する
2023/10/21 さまざまなチャットAIを簡単にローカル環境で動かせるアプリ「Ollama」の公式Dockerイメージが登場
2023/10/20 “政府認定クラウドサービス”登録で開示される情報・されない情報 リスト入りを目指すときの注意点
2023/10/20 State of AI Report 2023
2023/10/19 AnthropicのAIチャット「Claude 2」、日本語に対応
2023/10/19 LLMにナレッジグラフ(知識グラフ)を連携させることで、タスク遂行能力を大幅に向上させるフレームワーク『Graph Neural Prompting(GNP)』
2023/10/17 Pythonの高速スーパーセット「Mojo」がAppleシリコン搭載Macに対応間近。Windowsより先に
2023/10/17 AlpacaEval の概要
2023/10/17 PFN、深層学習専用チップを材料探索クラウドに実装
2023/10/17 最近話題の マルチモーダルLLM まとめ
2023/10/16 LLMのfinetuning手法「LoRA」について
2023/10/16 生成AIとクリエイターはどう共存するのか アドビが考える透明性と法律
2023/10/15 日本のスタートアップの現状と今後の展望
2023/10/14 24時間365日動き続けるデータシステムの設計手法 : 「データ指向アプリケーションデザイン」実践編
2023/10/14 Amazon Bedrock で使用できるモデル(LLM)仕様を比較・整理してみた
用語
【LLM・生成AI】
- 国立情報学研究所(NII)のLLM-jp-13B:130億パラメータを持つ大規模な言語モデルで、NIIが主宰するLLM勉強会(LLM-jp)の一環として開発された。開発は、データ活用社会創成プラットフォームmdxを計算資源として利用し、今年の5月から開始され、最近モデルの事前学習とチューニングが完了し、2023年10月20日に公開された。
- 日本のPFN (Preferred Networks)のMN-Core:ディープラーニングのためのカスタムプロセッサシリーズで、大量の計算力をサポートするために設計されている。ディープラーニングモデルのトレーニングを高速化するために最適化されている。
- Claude2:Anthropicの最新のLLM。Amazon Bedrockで使える。2023/10/16に日本語に対応した。
- Ernie 4.0:中国のBaiduによって開発された最新版の生成型人工知能(AI)モデルで、OpenAIのGPT-4モデルと同等の能力を持っていると発表されている。
- NEC Generative AI Framework:NEC Corporationによって開発されたソフトウェアフレームワークであり、企業が大規模言語モデルを効率的に統合し、運用することを支援する目的で設計されている。
【LLMをはじめとした生成AIの技術】
- Diagnosis of Thought (DoT):精神疾患に対処するために開発されたAIアシスタント。認知の歪みを検出するタスクに対応。
- LoRA (Low-Rank Adaptation):大規模な言語モデルのファインチューニング方法の一つ。LoRAは、特定のタスクやデータセットに対してモデルを特化させるための技術として提案され た。
- AlpacaEval:LLMモデルが一般的なユーザーの指示にどの程度従えるかを評価する「AlpacaFarm」という評価セットを使用し、モデルの応答をGPT-3 (text-davinci-003)と比較する。
- AutoAWQ:量子化および推論をより簡単に行うためのパッケージとして作成され、AWQ (Activation-aware Weight Quantization) モデルを使用する際の利便性を向上させることを目的としています
- AWQ (Activation-aware Weight Quantization):大規模言語モデルを量子化(圧縮)し、推論のランタイムおよびストレージ要件を削減する、シンプルかつ強力な方法。重みを事前に量子化し、推論中に動的にアクティベーションを量子化するアルゴリズム。
- LMOps (Large Language Model Operations) :大規模言語モデルのライフサイクル、つまり開発、デプロイメント、および保守を管理するためのMLOps(Machine Learning Operations)のLLM特化版。
- LlamaIndex:LLMアプリケーションがプライベートまたはドメイン固有のデータを取り込み、構造化し、アクセスするためのデータフレームワーク。
- Graph Neural Prompting (GNP):大規模言語モデルの性能向上を図る新しい方法で、知識グラフ(KGs)を活用する。LLM以前のKGsをLLMsと組み合わせた試みは、計算コストとモデルの複雑さに関する課題があった。
- PandasAI:Pythonのライブラリで、人気のデータ解析および操作ツールであるpandasに対してGenerative AI(生成AI)の機能を追加する。PandasAIはpandasと連携して使用され、pandasの代わりになるものではない。
- MT-Bench:MT-Benchは80の高品質でマルチターンの質問を含む、慎重にキュレーションされたLLM のベンチマークとして機能する。
- DiagrammerGPT:テキストから図表を生成する新しいフレームワーク。まず最初にGPT-4などのLLM(Language-and-Layout Model、言語とレイアウトモデル)を使用して「図表プラン」を生成し、次にこれらのプランに基づいて図表を生成する。
- StreamingLLM:無限のシーケンス長に対応可能な効率的なフレームワークであり、特定の大規模言語モデル (LLMs) の訓練を支援するもの。
- Flash Attention:自然言語処理タスクのための高効率なAttention機構。トークン間の依存関係を効果的に捉えることで、計算コストを削減しつつ、高いパフォーマンスを達成する。
- Ollama:大規模言語モデル(LLMs)をローカルで簡単にセットアップおよび利用するために設計されたツールで、macOS上でLlama 2や他のモデルをスムーズに実行できる。
【AI・データ分析】
- Gradio:機械学習モデルのインタラクティブなウェブインターフェースを作成することができるツール。Scikit-learn, PyTorch, NumPy, seaborn, pandas, Tensor Flowなど、多くの人気のあるPythonライブラリと統合可能。
- セマンティック検索:セマンティック検索は単にキーワードの一致を見るのではなく、クエリの意味やコンテキストを解析し、それに基づいて関連性の高い結果を提供する。
- PyGMT:地理空間および地球物理学データの処理および出版品質のマップや図を作成するためのライブラリであり、Generic Mapping Tools (GMT)のPythonicなインターフェイスを提供している。
- Mojo:人工知能(AI)のソフトウェア開発、特にMLIRコンパイラフレームワーク向けに開発されたプログラム言語で、Pythonの使いやすさとCのパフォーマンスを組み合わせている。
- FireDucks:Pythonのデータ分析ライブラリであるpandasを高速化するために設計された。NEC Corporationによって開発され、データ分析の準備段階を最大で16倍高速化することができる。
【Apple】
- AppleのFerret:多モーダル大規模言語モデル (MLLM) で、画像内の任意の形状や粒度に関する空間的な参照を理解する能力を持つ。
【OpenAI】
- GPT-4V:OpenAIによって開発されたマルチモーダルAIで、従来のテキスト処理能力に加えて、画像解析機能と音声出力機能を持つ。画像や音声を入力として受け取り、それに関連する情報や質問にテキストや音声で応答することができる。
- OpenAIのWhisper API:OpenAIによって開発された自動音声認識(ASR)システムであり、Whisper APIは、このASRシステムを利用するためのAPI。Webから収集された680,000時間の多言語および多タスクの監視データに対して訓練されている。
【Amazon】
- Amazon Bedrock:APIを通じて基盤モデル(Foundation Models、FM)を利用できる完全マネージド型サービスで、これには大規模言語モデル(LLM)も含まれる。Amazon Titan, Jurassic, Claude (Anthropic社のLLM), Llama 2, Stable Diffusionが使える。
【Meta】
- Meta Quest 3:Metaによる最新のVRヘッドセットで、40%スリムなビザー、高解像度、強化された3D空間オーディオ、Qualcomm Snapdragon XR2 Gen 2チップセットなどを特徴とする。改善されたMixed Reality機能と新しいコントローラーも搭載し、ゲームや複合現実体験を提供する。
【アプリケーション開発】
- Terraform:HashiCorpが開発したオープンソースの「Infrastructure as Code」(IaC)ツール。クラウドリソースやインフラストラクチャをコードで定義し、その定義に基づいてリソースを作成、更新、管理することができる。
【データ基盤・インフラ】
- AlloyDB Omni:Google Cloudがリリースした高性能なPostgreSQL互換ソフトウェア。「AlloyDB AI」を搭載し、AIアプリケーション開発を容易にする。AlloyDB Omniは開発や非商用利用では無料で利用可能で、商用利用には有料のサブスクリプションが提供される。
- Google Cloud Spanner:Google Cloudの分散型クラウドデータベースサービスで、グローバルな規模での高可用性、スケーラビリティ、トランザクション性能を提供する。
- dbt (data build tool):データウェアハウス内のデータを効果的に変換するためのオープンソースツールで、SQLでデータモデリングを行い、バージョン管理、ドキュメンテーション自動化、テストの統合などをサポートしている。
- Databricks:データウェアハウスとデータレイクの利点を統合したレイクハウスアーキテクチャを提供する米国企業。このプラットフォームでは、データ、分析、AIを単一の場所で効率的に管理・分析できる。
- Alteryx Designer Cloud:クラウドベースのデータ準備ソリューションで、データパイプラインの構築と自動化を簡易かつ効率的に行うことができるツール。
2023/10/22のピックアップ
今日の気になる用語
- Window attention:特に長い入力シーケンスを扱うシナリオで、性能を向上させ、計算の複雑さを管理し、メモリのフットプリントの問題を処理するために、注意ベースのモデルで利用されるしくみ。
- StreamingLLM:無限のシーケンス長に対応可能な効率的なフレームワークであり、特定の大規模言語モデル (LLMs) の訓練を支援するもの。
- Flash Attention:自然言語処理タスクのための高効率なAttention機構。トークン間の依存関係を効果的に捉えることで、計算コストを削減しつつ、高いパフォーマンスを達成する。
- Mojo:人工知能(AI)のソフトウェア開発、特にMLIRコンパイラフレームワーク向けに開発されたプログラム言語で、Pythonの使いやすさとCのパフォーマンスを組み合わせている。
今日の気になる記事
【LLMをはじめとした生成AIの技術】
2023/10/22 LLMと遺伝的アルゴリズムを使用して、個性によって社会集団の行動がどのように変化していくのかを観察する挑戦的な研究が行われました。
2023/10/22 Google Colab で StreamingLLM を試す
2023/10/22 LLMを3倍高速にする手法「FlashAttention」を解説!
【データ基盤】
2023/10/22 dbt-athenaでAudit_helperのテーブル監査支援機能を試してみた
【Mojo】
2023/10/22 Pythonの35000倍速い新言語Mojo🔥 に触れてみた【基礎編】
【IT・AIの活用と未来】
2023/10/22 Habitat 3.0 の概要
【サービス作ってみた】
2023/10/22 画像生成AI「DALL-E3」を使って2Dドットゲームの背景を生成する
【OpenAI】
2023/10/22 OpenAI API 課金額の観点で英語を使うべき理由
2023/10/21のピックアップ
今日の気になる用語
- Ollama:大規模言語モデル(LLMs)をローカルで簡単にセットアップおよび利用するために設計されたツールで、macOS上でLlama 2や他のモデルをスムーズに実行できる。
- Databricks:データウェアハウスとデータレイクの利点を統合したレイクハウスアーキテクチャを提供する米国企業。このプラットフォームでは、データ、分析、AIを単一の場所で効率的に管理・分析できる。
- 国立情報学研究所(NII)のLLM-jp-13B:130億パラメータを持つ大規模な言語モデルで、NIIが主宰するLLM勉強会(LLM-jp)の一環として開発された。開発は、データ活用社会創成プラットフォームmdxを計算資源として利用し、今年の5月から開始され、最近モデルの事前学習とチューニングが完了し、2023年10月20日に公開された。
- FireDucks:Pythonのデータ分析ライブラリであるpandasを高速化するために設計された。NEC Corporationによって開発され、データ分析の準備段階を最大で16倍高速化することができる。
今日の気になる記事
【LLMをはじめとした生成AIの技術】
2023/10/21 特定の個人の好みやニーズに最も適したレスポンスや行動を行うLLMを開発する手法、『Personalized Soups(意訳:ぼくだけのためのスープ)』が開発されました。
2023/10/21 さまざまなチャットAIを簡単にローカル環境で動かせるアプリ「Ollama」の公式Dockerイメージが登場
【LangChain】
2023/10/21 LangChain: チャンクにmetadataを追加する
【AI・データ分析】
2023/10/21 言語処理100本ノック2020 (20~29)
2023/10/21 言語処理100本ノック2020 (10~19)
2023/10/21 【Blender×Python】Pythonで作成したコードでメッシュの頂点を移動させる方法
2023/10/21 最小二乗法の幾何学的な意味
2023/10/21 Import を変更するだけで高速化!? Pandas 互換ライブラリ FireDucks を検証する
【サービス作ってみた】
2023/10/21 Pygameド素人がRPGを作る レベル1
2023/10/21 N番煎じでLLM-jp 13BをDatabricksで動かす
2023/10/21 Amazon Bedrcok + Amazon KendraのRAGパターンをboto3で自前実装してみる
2023/10/20 OpenAI APIとLangChainを用いた記事の翻訳・要約メディアのつくり方
【OpenAI】
2023/10/21 「AI界のiPhone」を作りたいOpenAI
【その他の会社】
2023/10/21 NVIDIA、ロボットに“高速ペン回し”も教えるGPT-4搭載AI「Eureka」
【開発関連技術】
2023/10/21 初心者が Fastly の基本を理解してみる
2023/10/20 Java 21の概要 / outline of Java 21
2023/10/20のピックアップ
今日の気になる用語
- DiagrammerGPT:テキストから図表を生成する新しいフレームワーク。まず最初にGPT-4などのLLM(Language-and-Layout Model、言語とレイアウトモデル)を使用して「図表プラン」を生成し、次にこれらのプランに基づいて図表を生成する。
- Alteryx Designer Cloud:クラウドベースのデータ準備ソリューションで、データパイプラインの構築と自動化を簡易かつ効率的に行うことができるツール。
- Firebase Authentication:Googleが提供するFirebaseプラットフォームの一部であり、アプリケーション開発者がユーザー認証を簡単かつ安全に管理できるようにするサービス。
- 国立情報学研究所(NII)のLLM-jp-13B:130億パラメータを持つ大規模な言語モデルで、NIIが主宰するLLM勉強会(LLM-jp)の一環として開発された。開発は、データ活用社会創成プラットフォームmdxを計算資源として利用し、今年の5月から開始され、最近モデルの事前学習とチューニングが完了し、2023年10月20日に公開された。
- OpenAIのWhisper API:OpenAIによって開発された自動音声認識(ASR)システムであり、Whisper APIは、このASRシステムを利用するためのAPI。Webから収集された680,000時間の多言語および多タスクの監視データに対して訓練されている。
- Amazon Transcribe:AWSが提供する自動音声認識(ASR)サービス。音声ファイルをテキストに変換する。
- Blender:オープンソースの3Dコンピュータグラフィックスソフトウェア。
今日の気になる記事
【LLM・生成AI】
2023/10/20 NII、130億パラメータのLLM構築 コーパスなども全公開 「今後の研究に資するため」
【LLMをはじめとした生成AIの技術】
2023/10/20 電気回路図などの図表をテキストのみから生み出すLLM駆動のフレームワーク『DiagrammerGPT(ダイアグラマーGPT)』が登場しました。
2023/10/20 「DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか?」に対するOpenAIの論文が発表されました。
2023/10/20 LLMがソフトウェアエンジニアリングでどのように適用可能か、網羅的な調査&分析結果
2023/10/20 自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた
【データ基盤】
2023/10/20 【新機能】Alteryx Designer Cloudでスケジュール実行してSlackに通知を飛ばしてみた #alteryx
【AI・データ分析】
2023/10/20 Blenderで16bitのパラメーターを画像テクスチャー経由で使用する
【IT・AIの活用と未来】
2023/10/20 「GPT-4」は論文の査読ができるか? 米スタンフォード大らが検証 参加者の80%以上「AI査読は有益」
2023/10/20 State of AI Report 2023
【サービス作ってみた】
2023/10/20 [LINE WORKS] GPTとFunction Callingを使ってカレンダーに予定を入れてくれるアシスタントbotを作ってみる
2023/10/20 Blender Python MIDIを使ってピアノを動かす!
【開発関連技術】
2023/10/20 JavaScript Server Runtime History
2023/10/20 “政府認定クラウドサービス”登録で開示される情報・されない情報 リスト入りを目指すときの注意点
【科学・技術】
2023/10/20 より高速なRubyのWebAssembly実装「Ruvy」、Shopifyがオープンソースで公開。Ruby仮想マシンとRubyアプリを組み合わせてビルド
2023/10/20 高速回転する磁石を別の磁石に近づけると磁石が回転・浮上するという不思議な現象の秘密が解明される
【教育・マネジメント】
2023/10/20 Engineering Managerという役割がなぜわかりづらいのか
【その他】
2023/10/20 Firebase Authentication によるログイン機能を試す – Web版
2023/10/20 トヨタ、テスラの充電規格を採用へ 北米で販売するEVで 日産・ホンダに続き
2023/10/20 古い地名を地図にまとめた「日本歴史地名大系」がお披露目 ~自由に使えるオープンデータ
2023/10/20 AMD、最大96コアの「Ryzen Threadripper PRO 7000 WX」を11月21日に発売。非PROも
2023/10/19のピックアップ
今日の気になる用語
- Graph Neural Prompting (GNP):大規模言語モデルの性能向上を図る新しい方法で、知識グラフ(KGs)を活用する。L以前のKGsをLLMsと組み合わせた試みは、計算コストとモデルの複雑さに関する課題があった。
- watsonx:IBMによって開発されたAIおよびデータプラットフォームであり、ビジネス向けに設計されている。3つのコアコンポーネントと一連のAIアシスタントを提供する。
- GMT(Generic Mapping Tools):地理学的およびデカルトデータセットを操作し、単純なx-yプロットから等高線マップ、人工的に照らされた表面、3Dパースペクティブビュー、およびアニメーションに至るまでの高品質の図を作成するための約100のコマンドラインツールのオープンソースコレクション。
- PyGMT:地理空間および地球物理学データの処理および出版品質のマップや図を作成するためのライブラリであり、Generic Mapping Tools (GMT)のPythonicなインターフェイスを提供している。
- PandasAI:Pythonのライブラリで、人気のデータ解析および操作ツールであるpandasに対してGenerative AI(生成AI)の機能を追加する。PandasAIはpandasと連携して使用され、pandasの代わりになるものではない。
- Claude2:Anthropicの最新のLLM。Amazon Bedrockで使える。2023/10/16に日本語に対応した。
- MT-Bench:MT-Benchは80の高品質でマルチターンの質問を含む、慎重にキュレーションされたLLM のベンチマークとして機能する。
- Amazon CodeWhisperer:既存のコードとコメントに基づいて自動的に提案を生成する。
今日の気になる記事
【LLM・生成AI】
2023/10/19 ついに日本で利用可能になったChatGPTの強力ライバル「Claude」使用レビュー、テキストファイルやPDFファイルの認識も可能でランチの相談からコーディング補助までサクサク応答
2023/10/19 AnthropicのAIチャット「Claude 2」、日本語に対応
【LLMをはじめとした生成AIの技術】
2023/10/19 LLMにナレッジグラフ(知識グラフ)を連携させることで、タスク遂行能力を大幅に向上させるフレームワーク『Graph Neural Prompting(GNP)』
2023/10/19 MT-Bench の概要
【AI・データ分析】
2023/10/19 Google ColaboratoryでGMT(PyGMT)を使う #1
2023/10/19 PandasAIにおけるLLMを用いた自然言語クエリの仕組み
【IT・AIの活用と未来】
2023/10/19 中国がAIで知的財産を盗んでいるとアメリカなど5カ国の「ファイブ・アイズ」が異例の警告
2023/10/19 NTT法廃止は「絶対に反対」3キャリアをはじめ全国180者が連名で要望書
2023/10/19 「NTT法は結果として廃止へ」 NTT島田社長が見直し方針を説明
2023/10/19 GPT-4やLlama 2の透明性をスタンフォード大HAIが評価 トップはMetaでOpenAIは3位
【サービス作ってみた】
2023/10/18 GPT-4VでFlutterの計算機アプリを依頼したら凄かった
2023/10/18 日本語の単語や文法を自然な英語で説明できるLLM「JapSensei」をfinetuningで作りました。
【Amazon】
2023/10/19 IBMの生成AI「watsonx」がAWS上で利用可能に 2社が連携強化
2023/10/19 AWSのコード生成AI「CodeWhisperer」、生成モデルのカスタマイズが可能に。社内の独自ライブラリやAPIを生成コードに組み込める新機能がプレビュー公開
2023/10/19 [プレビュー] Amazon CodeWhisperer はユーザーが所有するプライベートなコード資産を使って推奨事項をカスタマイズ出来るようになりました
2023/10/19 AWS Lambda でOpenAI の Whisper API を 認識精度の改善も含めて試してみた
【その他の会社】
2023/10/19 YouTubeが「ミュージシャンの声を使った動画を作成するためのAIツール」のリリースに向けてメジャーレーベルと協議を進めている
2023/10/19 NVIDIAとFoxconnが提携して自動運転EV・自律機械・言語モデルの開発を加速するデータセンター「AIファクトリー」建造計画を発表
2023/10/19 ドコモ田村副社長ロングインタビュー、ドコモのネットワーク部門を率いるキーパーソンが語る課題と使命感
【開発関連技術】
2023/10/19 オラクル、Java開発を効率化するVSCode用拡張機能「Oracle Java Platform Extension for Visual Studio Code」を公開
【教育・マネジメント】
2023/10/19 「引き継ぎできない!」から始まった私のスクラム – 川口恭伸の「はじめてのアジャイル」
【その他】
2023/10/19 ウクライナ派のハッカーがランサムウェア集団「Trigona」をハッキングしサーバーを焼き払うことに成功
2023/10/19 もうパスワードは使わない、任天堂も対応する「パスキー」の正体
2023/10/18 全銀ネット障害、いまだ根本原因特定できず メモリ不足の指摘には「分からない」
2023/10/18のピックアップ
今日の気になる用語
- DreamGaussian:効率と品質の両立を実現する新しい3Dコンテンツ生成フレームワーク。このフレームワークは、画像やテキストを入力として受け取り、それらを使用してテクスチャ付きの3Dメッシュを生成することができる。
- Gaussian Splatting:、3Dグラフィックスや画像処理の領域で用いられる技術。各データポイントをガウス関数(正規分布)で表現し、これらのガウス関数を重ね合わせることで、データポイントを3D空間や2D画像空間上に滑らかに分布させる。
- Meta Quest 3:Metaによる最新のVRヘッドセットで、40%スリムなビザー、高解像度、強化された3D空間オーディオ、Qualcomm Snapdragon XR2 Gen 2チップセットなどを特徴とする。改善されたMixed Reality機能と新しいコントローラーも搭載し、ゲームや複合現実体験を提供する。
- AWS Fargate:AWSが提供するサーバーレスコンピュートエンジンで、コンテナを実行するためのサービス。Fargateは、インフラストラクチャの管理やクラスタのプロビジョニング、サーバーの管理を行う必要なく、アプリケーションをコンテナとして実行することを可能にする。
- Amazon Bedrock:APIを通じて基盤モデル(Foundation Models、FM)を利用できる完全マネージド型サービスで、これには大規模言語モデル(LLM)も含まれる。Amazon Titan, Jurassic, Claude (Anthropic社のLLM), Llama 2, Stable Diffusionが使える。
- NEC Generative AI Framework:NEC Corporationによって開発されたソフトウェアフレームワークであり、企業が大規模言語モデルを効率的に統合し、運用することを支援する目的で設計されている。
- Ernie 4.0:中国のBaiduによって開発された最新版の生成型人工知能(AI)モデルで、OpenAIのGPT-4モデルと同等の能力を持っていると発表されている。
- LangChainのLangSmith:LangChainによって提供されるプラットフォームで、言語モデルアプリケーションのプロトタイプからプロダクションへの移行を支援する。全てのアプリケーションライフサイクルの各ステップに対して一体型の開発者プラットフォームを提供する。
- 日本のLangSmith社のLangSmith Editor:日本のLangsmith Inc.(ラングスミス株式会社)が提供するインタラクティブな学術テキスト修正システムで、主に英語を使用する学生や研究者を対象としている。医学、化学、生物学、計算機科学、心理学の分野。
- LLMOps (Large Language Model Operations) :大規模言語モデルのライフサイクル、つまり開発、デプロイメント、および保守を管理するためのMLOps(Machine Learning Operations)のLLM特化版。
- LlamaIndex:LLMアプリケーションがプライベートまたはドメイン固有のデータを取り込み、構造化し、アクセスするためのデータフレームワーク。
- Gradio:機械学習モデルのインタラクティブなウェブインターフェースを作成することができるツール。Scikit-learn, PyTorch, NumPy, seaborn, pandas, Tensor Flowなど、多くの人気のあるPythonライブラリと統合可能。
- セマンティック検索:セマンティック検索は単にキーワードの一致を見るのではなく、クエリの意味やコンテキストを解析し、それに基づいて関連性の高い結果を提供する。
- dbt (data build tool):データウェアハウス内のデータを効果的に変換するためのオープンソースツールで、SQLでデータモデリングを行い、バージョン管理、ドキュメンテーション自動化、テストの統合などをサポートしている。
- Databricks:データウェアハウスとデータレイクの利点を統合したレイクハウスアーキテクチャを提供する米国企業。このプラットフォームでは、データ、分析、AIを単一の場所で効率的に管理・分析できる。
- Vercelのv0:AIを利用してReactコードを生成し、Shadcn UIおよびTailwind CSSと互換性のあるコードを提供する。
今日の気になる記事
【LLM・生成AI】
2023/10/18 Baiduが大規模言語モデル「Ernie 4.0」を発表、全ての点でGPT-4に匹敵する実力を持つ
2023/10/18 NECの大規模言語モデルが一般初公開 現地の様子は
【LLMをはじめとした生成AIの技術】
2023/10/18 GPT-4などLLMのコード生成能力にデバッグ機能を追加する『SELF-DEBUGGING(セルフデバッギング)』フレームワークが考案されました。
2023/10/18 GPT-4との対話でタスクプランニングを行うロボットシステムフレームワークが発明されました。
2023/10/18 Google Colab で DreamGaussian を試す
2023/10/18 Google Colab で 4D Gaussians Splatting を試す
2023/10/18 普通の映像から“動いている3Dシーン”をリアルタイム生成できる「4D Gaussian Splatting」【研究紹介】
2023/10/18 生成AIで本番アプリをリリースするためのAWS, LangChain, ベクターデータベース実践入門 / LangChain-Bedrock
2023/10/18 LLM / ChatGPT の現状理解 と 2023年10月版 LLM情報アップデート (Bio”Pack”athon 2023 #10 トーク用)
2023/10/18 LangSmith で始める LLMOps
【データ基盤】
2023/10/18 [新機能]dbt Cloudの操作をローカルのCLIから行える「dbt Cloud CLI」を試してみた
2023/10/18 Databricksでセマンティック検索がサポートされました!
【AI・データ分析】
2023/10/18 Matplotlibでimshow画像の軸目盛りの調整:extentとsecondary_axisの活用
2023/10/18 python の imshow と pcolormesh を用いた2Dヒストグラム生成時の微妙な違いを整理してみる
2022/10/3 Gradioとは? Pythonで機械学習Webアプリケーションをサクッと作ろう!
2023/10/18 Google Colaboratory Pro+で24時間を超える実行を実現する方法
【IT・AIの活用と未来】
2023/10/18 自動運転はもはや未来の技術ではない。テスラ、HUAWEI、バイドゥにみる「レベル2+」の自動運転車の課題
【サービス作ってみた】
2023/10/18 Amazon Bedrockを用いたチャットAPIをコンテナ上で構築! 〜後編:AWS Fargate編〜
2023/10/18 自前のチャットボットを「LlamaIndex+GPT4+gradio」で爆速構築してみよう!
2023/10/18 Amazon ConnectとLexでのコールセンター向けAIチャットボットで、Function Callingを利用し、発話内容から必要な情報を補正しつつJSON形式で抽出してみた
【Meta】
2023/10/18 Meta Quest 3 の Depth API を試す
【OpenAI】
2023/10/18 ChatGPTのGPT-4Vを使ってSQL文を画像から作成する
【その他の会社】
2023/10/18 「世界トップレベルの大規模言語モデルの開発に着手」──産総研らが表明 目指すのは“GPT-3級の日本語LLM”
2023/10/18 サイバーエージェント、生成AIの活用推進する「AIオペレーション室」
2023/10/18 Vercel、生成AIへのプロンプトでWebアプリのUIを自動生成してくれる「v0」をベータ公開。Freeプランも提供
【その他】
2023/10/18 内部不正による情報漏えいを防ぐには IPAが“内部不正防止ガイドライン”無料公開中
2023/10/18 アメリカが中国へのAIチップ輸出制限を強化しNVIDIA製チップの輸出が困難に
2023/10/18 NTTビジネスソリューションズ元派遣社員による顧客情報の不正な持ち出しについてまとめてみた
2023/10/17のピックアップ
今日の気になる用語
- 国立研究開発法人 情報通信研究機構 (NICT):日本の情報通信技術の研究開発を行う公的機関。
- WarpDrive:NICTが開発しているWeb媒介型サイバー攻撃の実態把握と対策技術向上を目的としたプロジェクト。
- AlpacaEval:LLMモデルが一般的なユーザーの指示にどの程度従えるかを評価する「AlpacaFarm」という評価セットを使用し、モデルの応答をGPT-3 (text-davinci-003)と比較する。
- 日本のPFN (Preferred Networks)のMN-Core:ディープラーニングのためのカスタムプロセッサシリーズで、大量の計算力をサポートするために設計されている。ディープラーニングモデルのトレーニングを高速化するために最適化されている。
- Matlantis:Preferred Networks (PFN) とENEOS Corporation (ENEOS) によって共同開発された普遍的な原子レベルのシミュレータ。新しい材料の原子レベルでの振る舞いをコンピュータ上で再現し、大規模な材料探索をサポートする。
- AutoAWQ:量子化および推論をより簡単に行うためのパッケージとして作成され、AWQ (Activation-aware Weight Quantization) モデルを使用する際の利便性を向上させることを目的としています
- AWQ (Activation-aware Weight Quantization):大規模言語モデルを量子化(圧縮)し、推論のランタイムおよびストレージ要件を削減する、シンプルかつ強力な方法。重みを事前に量子化し、推論中に動的にアクティベーションを量子化するアルゴリズム。
今日の気になる記事
【LLMをはじめとした生成AIの技術】
2023/10/17 人物の「不自然さ」を極限まで取り除いて超リアルな画像を生成する『HyperHuman(ハイパーヒューマン)』
2023/10/17 AlpacaEval の概要
2023/10/17 最近話題の マルチモーダルLLM まとめ
2023/10/17 LLMのトレーニングでよく調整するパラメータについて
2023/10/17 GPTやLlamaなどの大規模言語モデルはファインチューニングで簡単に脱獄可能だという研究結果
2023/10/16 OpenAIのGPTシリーズとBedrockのClaudeをコスト比較してみた
2023/10/16 AutoAWQ用のlangchainのカスタムChat Modelを作る
【Mojo】
2023/10/17 Pythonの高速スーパーセット「Mojo」がAppleシリコン搭載Macに対応間近。Windowsより先に
【データ基盤】
2023/10/17 [新機能]dbt Cloudで本番環境とのdefer(差分)を取得して新規開発したモデルだけを開発環境でbuildできるようになりました
【AI・データ分析】
2023/10/17 ファッションにおける類似商品検索アルゴリズムの性能評価
【IT・AIの活用と未来】
2023/10/17 ソニーホンダ、次世代EV「AFEELA Prototype」初披露 アプリ・サービス開放
2023/10/17 メルカリ、生成AIで「売れやすいタイトル」に変更
【サービス作ってみた】
2023/10/17 Amazon Bedrockを用いたチャットAPIをコンテナ上で構築! 〜前編:Docker編〜
【Meta】
2023/10/17 Meta Quest 3 の Mesh API を試す
【その他の会社】
2023/10/17 完全自動運転にLLMは必要か?
2023/10/17 Xiaomi、“人、車、スマートホームのための新OS”「HyperOS」発表
2023/10/17 PFN、深層学習専用チップを材料探索クラウドに実装
2023/10/17 Oracle Analytics Cloud:データフローで機械学習を試してみる
2023/10/17 Arm上場 スマホ時代の超優良企業はAI時代もリードできるか
【開発関連技術】
2023/10/17 ソースコードのハッシュ値を利用したCIの高速化
2023/10/17 見るべきは「CVSSスコア」“だけ”でいいのか? 脆弱性管理に役立つ指標をまとめてみた
【教育・マネジメント】
2023/10/17 NICT、攻殻機動隊の世界でIT知識が学べるゲーム機能を「WarpDrive」へ追加
2023/10/17 社内のNotion交流会でNotionでのタスク管理について発表しました
【その他】
2023/10/17 視力によらず映像のピントが合う「直接網膜投影方式」のAR/VRグラスを展示するTDK
2023/10/16 LangChainで生成AIアプリ開発に入門できる名著が出ました!
2023/10/16 「Intelは大きな脅威ではない」と台湾の半導体メーカーTSMCの創設者が発言、2nmプロセスの開発が順調に進んでいることも明かす
2023/10/16 全銀システム障害の原因判明、メモリー不足でインデックステーブルが不正確な状態に
2023/10/16のピックアップ
今日の気になる用語
- Diagnosis of Thought (DoT):精神疾患に対処するために開発されたAIアシスタント。認知の歪みを検出するタスクに対応。
- LoRA (Low-Rank Adaptation):大規模な言語モデルのファインチューニング方法の一つ。LoRAは、特定のタスクやデータセットに対してモデルを特化させるための技術として提案され た。
- イミュータブルドキュメントモデル:データやドキュメントが一度作成されると変更できないモデル。このモデルは、特に分散システムやブロックチェーン技術などのコンテキストで重要となる。
- フロー情報:特定の期間や瞬間に関連する情報を指す。
- ストック情報:: ストック情報は、過去から現在までの累積された情報。
- AppleのFerret:多モーダル大規模言語モデル (MLLM) で、画像内の任意の形状や粒度に関する空間的な参照を理解する能力を持つ。
- Terraform:HashiCorpが開発したオープンソースの「Infrastructure as Code」(IaC)ツール。クラウドリソースやインフラストラクチャをコードで定義し、その定義に基づいてリソースを作成、更新、管理することができる。
- Infrastructure as Code:インフラストラクチャの設定と管理をコードとして定義・実行するアプローチ。従来、サーバーやネットワークの設定は手動で行われることが多かったが、IaCを採用することで、これらの設定を自動化し、再現性と一貫性を持たせることができる。
- AlloyDB Omni:Google Cloudがリリースした高性能なPostgreSQL互換ソフトウェア。「AlloyDB AI」を搭載し、AIアプリケーション開発を容易にする。AlloyDB Omniは開発や非商用利用では無料で利用可能で、商用利用には有料のサブスクリプションが提供される。
- Google Cloud Spanner:Google Cloudの分散型クラウドデータベースサービスで、グローバルな規模での高可用性、スケーラビリティ、トランザクション性能を提供する。
- GPT-4V:OpenAIによって開発されたマルチモーダルAIで、従来のテキスト処理能力に加えて、画像解析機能と音声出力機能を持つ。画像や音声を入力として受け取り、それに関連する情報や質問にテキストや音声で応答することができる。
- Meta Quest 3:Metaによる最新のVRヘッドセットで、40%スリムなビザー、高解像度、強化された3D空間オーディオ、Qualcomm Snapdragon XR2 Gen 2チップセットなどを特徴とする。改善されたMixed Reality機能と新しいコントローラーも搭載し、ゲームや複合現実体験を提供する。
- Amazon Bedrock:APIを通じて基盤モデル(Foundation Models、FM)を利用できる完全マネージド型サービスで、これには大規模言語モデル(LLM)も含まれる。
今日の気になる記事
【LLMをはじめとした生成AIの技術】
2023/10/16 LLMがソフトウェアエンジリアリングにおいて現時点で役に立つこと&課題。Metaなどの研究者らが報告
2023/10/16 GPT-4をセラピストとして実行し、「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』と実行プロンプト
2023/10/16 LLMのfinetuning手法「LoRA」について
2023/4/18 [輪講資料] LoRA: Low-Rank Adaptation of Large Language Models
2023/4/10 LoRA: Low-Rank Adaptaion of Large Language Models の解説
【LangChain】
2023/10/15 LangChainでカスタムエージェントを作る
【Open Interpreter】
2023/10/15 OpeninterpreterをAzure OpenAIで試す
【AI・データ分析】
2023/10/16 Kaggleのハードルを下げたい!
2023/10/16 第358話|エライ人に、『このデータで何かいい感じの結果をだして!」と言われたらどうする?
【IT・AIの活用と未来】
2023/10/16 相模原市、国産生成AIを導入へ 「自治体では初」 NECと共同検証
2023/10/16 MicrosoftとAdobeが推進する「AI透かし」はどのように機能するのか
2023/10/16 生成AIとクリエイターはどう共存するのか アドビが考える透明性と法律
2023/10/15 視覚障害者の助けとなるか。薬袋や薬品パッケージをImage inputs for ChatGPT(GPT-4V)を使って確認してみた
【サービス作ってみた】
2023/10/16 【Python】Traffic Generatorを作った
2023/10/16 DiscordでDeepL-APIを使用した翻訳Botを作る
【Google】
2023/10/16 gRPC入門: はじめてのgRPC
2023/10/15 Google Cloud、AI機能搭載のPostgreSQL互換ソフトウェア「AlloyDB Omni」正式版リリース
2023/10/15 Google Cloud Spanner、価格据え置きのままスループットを1.5倍に向上、ノード当たりのストレージも10TBに増強と発表
2022/12/26 高いけどスゴイ!『Cloud Spanner』を徹底解説
【Amazon】
2023/10/16 [資料公開]「AWSいまどきの監視(モニタリング)事情 -CloudWatchのその先に-」というタイトルで登壇してきました #jawsfesta #jawsug
【Meta】
2023/10/16 Building Blocks による Meta Quest 3 アプリの作成
2023/10/15 はじめての Meta Quest 3 アプリの作成
【Apple】
2023/10/16 アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明(生成AIウィークリー)
【OpenAI】
2023/10/16 OpenAI Function callingの関数定義に対する実験、考察
【Microsoft】
2023/10/16 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている
【その他の会社】
2023/10/16 Terraform、生成AIによるモジュールテストの自動生成を搭載、VSCodeでインフラコードの自動エラー検出機能も。HashiConf 2023
2020/9/3 5分で分かるTerraform(Infrastructure as Code)
【その他】
2023/10/16 宣言的でメンテナンスしやすいGoogle Sheetsという考え方
2023/10/16 社内ドキュメントはなぜ更新されないのか?情報の鮮度を最小限の運用負荷で維持する「イミュータブルドキュメントモデル」のススメ
2023/10/16 【永久保存版】Notionで実現できるExcel機能15選+α
【一週間のまとめ】2023/10/9~2023/10/15
記事ピックアップ
2023/10/15 AWSの構成図をChatGPT(GPT-4V)に読み込ませてIaCコードを生成してみた
2023/10/15 iCloudやGoogleドライブなど複数のクラウドストレージやデバイスのファイルを一括管理できるファイルマネージャー「Spacedrive」のアルファ版が公開される
2023/10/14 24時間365日動き続けるデータシステムの設計手法 : 「データ指向アプリケーションデザイン」実践編
2023/10/14 Amazon Bedrock で使用できるモデル(LLM)仕様を比較・整理してみた
2023/10/13 Google、検索フォームからAI生成画像 文章の下書き依頼も
2023/10/13 移動家具ロボ「カチャカ」、LLM対応 ”リビング、ゴミ”でも命令理解
2023/10/13 ICCV 2023速報
2023/10/12 Flappy:AI統合を単純化するための言語学習モデル(LLM)エージェントSDK
2020/11/1 統計解析パッケージPingouinを使ってみる
2023/10/12 自動運転AI開発:学習からシミュレーション、実車テストまで
2023/10/12 「クラウド時代のデータ活用基盤!最新動向と応用を徹底解説」でModern Data Stack界隈で注目されている4つの分野について話しました
2023/10/12 OpenAIが2023年11月に開発者向けの大規模なアップデートを実施か
2023/10/12 Dockerがコードネーム「Docker Debug」発表 コンテナ内に任意のデバッグツール群を一括導入、効率的なデバッグを実現
2023/10/12 Docker、ビルドを約40倍高速にする次世代のDocker Buildを開発中 Mastodonのビルドが2時間25分→3分40秒に
2023/10/11 LLMの開発は難しい?簡単?Stability AIの現場から (2023/10/11, W&B Fully Connected)
2023/10/11 Adobeの画像生成AI「Firefly」のAIモデルが「Firefly Image 2 Model」など3モデルにアップデート、人間のレンダリングが向上しよりリアルな表現が可能に
2023/10/11 画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。便利な新機能が大量に出たのでまとめて紹介します
2023/10/11 画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い
2023/10/11 【EMの業務解剖】事業タイプ別、評価制度を整える際に押さえるべきポイントを解説。最も重要なことは企業と社員の間の納得感。
2023/10/11 Google Cloud、生成AIを無料で学べる「The Arcade」公開 ゲーム感覚でポイントを稼ぎ、賞品も獲得可能
2023/10/10 ニューラルネットワークの中身を分割してAIの動作を分析・制御する試みが成功、ニューロン単位ではなく「特徴」単位にまとめるのがポイント
2023/10/10 JDLAが出した生成AI利用ガイドライン https://www.jdla.org/document/#ai-guideline
用語
【LLM・生成AI】
- Mistral AI:フランス・パリに拠点を置くAIスタートアップで2023年9月に新しいLLMであるMistral-7Bを発表。
- Mistral-7B:フランスのスタートアップMistral AIによって開発された新しい生成型AIモデルで、7十億のパラメータを持つ。
- LLaVA-1.5:ウィスコンシン大学とMicrosoftによって開発された、視覚と言語を効果的に結びつけるLarge Multimodal Models (LMM)の一つ。簡単な修正を加えることで、11のベンチマークで最先端の結果を達成。このモデルはデータ効率が良く、1.2Mの公開データを使用して1日でトレーニングが可能(OpenAIのGPT-4Vと類似)。
- Adobe Firefly:画像生成、テキスト効果、ベクター用の生成AIモデルを基盤としており、100以上の言語のテキストプロンプトをサポート。商用利用も可能で、Adobe Expressを通じて「テキストから画像生成」や「テキスト効果」などの機能が利用できる。
- PaLM2:Googleが2023年5月に発表したLLM。Google CloudのVertex AIでは、PaLM2とともにコード生成・補完モデルのCodeyも利用可能。
- Stable Diffusion XL:Stability AIによって発表された、テキストから画像を生成するための先進的なパッケージソフトウェア。モデルの微調整がより容易になった。
- Fooocus:Stable Diffusion XL (SDXL)のテキストから画像へのAIアートジェネレーションを簡略化し、最適化するために設計されたユーザーインターフェース。
- Japanese StableLM Instruct Alpha v2:Stability AIによって開発された、7Bパラメータを持つ日本語の言語モデル。このモデルは、指示応答(Instructive Response)タスクに特化しており、ユーザーからの指示や質問に対して詳細な回答を生成することができる。商用利用が可能。
- RWKV(Raven’s World-Knowledge Vectors):RNN(Recurrent Neural Network)をベースにしたモデルで、トランスフォーマーのような大規模言語モデル(LLM)と同等の性能を持っている。GPT(Generative Pretrained Transformer)のように直接トレーニングすることができ、並列化が可能。これにより、RNNとトランスフォーマーの両方の利点を組み合わせている。
- RWKV-4-World-JPNtuned:「RWKV」の日本語版で、学習データやトークナイザーが日本語用にチューニングされている。
【LLMをはじめとした生成AIの技術】
- Promptbreeder:特定のドメインでプロンプトを進化させて適応させる自己改善メカニズムで、タスクプロンプトの変異と評価を通じてプロンプトの改善を促進する技術。
- LangChain:言語モデルを利用したアプリケーションの開発を支援するフレームワークであり、このフレームワークを使用することで、言語モデルを他のデータソースに接続し、言語モデルとの相互作用を可能になる。
- RAG (Retrieval-augmented Generation):情報検索とテキスト生成を組み合わせ、事実を検証しながらより正確なテキスト回答を生成する技術。
- BERT4Rec:推薦システムにおいてユーザーの動的で進化する嗜好をその歴史的な行動からモデリングすることを目的とした手法で、BERTを利用したシーケンシャル(順序を持った)推薦を行う。
- Flappy:プロジェクトにおけるAI統合を単純化することを目的とした、本番環境での使用を前提とした言語学習モデル(LLM)アプリケーション/エージェントSDK(Software Development Kit)。
【データ基盤】
- Alembic:SQLAlchemyの作者によって書かれたデータベースマイグレーションツールであり、テーブルや他の構造の変更をデータベースに反映するためのALTER文を発行する機能を提供する。
- SQLAlchemy:SQLAlchemyは、Python言語用のSQLツールキットおよびObject Relational Mapping (ORM) システムで、データベースとの対話をより効率的かつ簡単に行うことができる。
- dbt (data build tool):データウェアハウス内のデータを効果的に変換するためのオープンソースツールで、SQLでデータモデリングを行い、バージョン管理、ドキュメンテーション自動化、テストの統合などをサポートしている。
- Databricks:データウェアハウスとデータレイクの利点を統合したレイクハウスアーキテクチャを提供する米国企業。このプラットフォームでは、データ、分析、AIを単一の場所で効率的に管理・分析できる。
- Knowledge Graph(知識グラフ):エンティティ(オブジェクト、コンセプトなど)とそれらのエンティティ間の関係を表現するグラフ構造のデータベース。
【AI・データ分析】
- 構造方程式モデリング(Structural Equation Modeling, SEM):複数の変数間の関係を同時に考慮しながら、変数間の因果関係や相互作用を分析するための統計的手法。
- streamsync:オープンソースのデータアプリケーションフレームワークで、Streamlitの代替として機能するが、Streamlitと比較して大幅に高速化されている。
- Elasticsearch:オープンソースの分散型検索エンジンであり、大量のデータをリアルタイムに迅速に検索し、分析することができる。Luceneを基盤としており、テキスト、数値、地理空間、構造化、非構造化データなど、多様なタイプのデータをサポートしている。
- ファウンデーション・モデル(基盤モデル):機械学習と人工知能(AI)の分野で用いられる用語で、大規模なプレトレーニング(事前学習)を行った後、特定のタスクやアプリケーションに対してファインチューニング(微調整)を行うことで、多くの異なるタスクやアプリケーションに適用可能なモデルを指す。
- pingouin:Pythonで使用できる統計ライブラリであり、主に統計解析と可視化を目的としている。
- ICCV (International Conference on Computer Vision):コンピュータビジョンに関する国際的な学術会議。
- DVC(Data Version Control):データサイエンスと機械学習プロジェクトのためのバージョンコントロールシステム。データとモデルのバージョン管理、データパイプラインのトラッキング、実験の履歴の管理を行う。
【Google】
- Colab AI:Google Colab上でコーディング支援を行うAIツール群で、2023年10月現在ではGoogle Colab Pro+のユーザーにのみ提供されている。提供されているAIツールには、AIによるオートコンプリート、自然言語によるコード生成、チャットボット、エラーの説明などが含まれる。
- Vertex AI Search:Google Cloudのエンタープライズ検索ソリューションで、テキスト検索、自然言語処理、機械学習を活用し、カスタム検索エンジンの構築とカスタム検索アルゴリズムによる情報取得を可能にする。
- Vertex AI:Google Cloudの機械学習(ML)およびディープラーニング(DL)プラットフォームで、データの簡単な準備からトレーニング、デプロイメント、監視までのMLワークフローを効率的にサポートする。AutoML機能も充実。
- GA4(Google Analytics4):Googleが開発したウェブサイトとアプリの両方からイベントベースのデータを収集する次世代のアナリティクスツール。2020年10月にリリースされたGA4は、ユーザー行動をより深く計測することができるのが最大の特徴。
- Colab AI:Google Colab上でコーディング支援を行うAIツール群で、2023年10月現在ではGoogle Colab Pro+のユーザーにのみ提供されている。提供されているAIツールには、AIによるオートコンプリート、自然言語によるコード生成、チャットボット、エラーの説明などが含まれる。
- SGE(Search Generative Experience):Googleが開発した検索体験を強化するための新しい実験的な機能で、生成AIを使用している。ユーザーがテキストプロンプトを使用して画像を生成したり、テキストベースのクエリに対してより詳細で具体的な回答を生成したりすることができる。
【Amazon】
- Amazon Kendra:AWSの高度な情報検索サービスで、自然言語処理を使用し、多様なデータソースから関連情報を高速に抽出できる。
【Meta】
- Meta Quest 3:Metaによる最新のVRヘッドセットで、40%スリムなビザー、高解像度、強化された3D空間オーディオ、Qualcomm Snapdragon XR2 Gen 2チップセットなどを特徴とする。改善されたMixed Reality機能と新しいコントローラーも搭載し、ゲームや複合現実体験を提供する。
【OpenAI】
- stable-baselines3:OpenAIが開発したPyTorchを使用して強化学習アルゴリズムの信頼できる実装を提供するセット。
【Microsoft】
- AutoGen:Microsoftが開発した大規模言語モデル(LLM)ワークフローを簡素化するフレームワークで、カスタマイズ可能で対話可能なエージェントを提供する。
- Microsoft Clarity:Microsoftが開発した無料のユーザー行動分析ツール。ユーザーがウェブサイト上でどのように行動しているかを分析し、そのデータをほぼリアルタイムで表示できる。
【その他の会社】
- AMD:ファブレス(製造設備を持たない)半導体企業で、高性能コンピューティングとグラフィックス製品を提供。主にCPUとGPUを開発。
- Nod.ai:人工知能(AI)と機械学習(ML)システムの企業で、未来のAIシステムのための主要なオープンソース技術を提供。チップメーカーのAMDが買収。
- AI TRiSM:Gartnerによって開発されたフレームワークで、AIのガバナンス、信頼性、公平性、信頼性、堅牢性、効果性、およびデータの管理を確保することを目的としている。
- Gartner:情報技術(IT)に関するリサーチとアドバイザリーサービスを提供する世界的な企業。
【開発関連技術】
- Linter:コード品質を向上し、一貫性を維持するためのツールで、ソースコード内のエラーやスタイルの違反を検出し、開発者に指摘する。
- Formatter:コードの自動整形を担当するツールで、コーディングスタイルの一貫性を保ち、可読性を向上させる。
- Ruff:特定のPythonパッケージやモジュールの品質やセキュリティに関する情報を提供するツール。Pythonコードのスキャンと分析を行い、セキュリティ上の脆弱性、コーディング規約に違反したコード、一貫性の問題、潜在的なバグなどを検出する。
- Cloudflare:ウェブサイトの速度とセキュリティを向上させるクラウドプラットフォーム。CDNサービス、DDoS防御、安全なDNSを提供し、ウェブトラフィックを効率的かつ安全に管理する。
- Cloudflare Hyperdrive:既存データベースへのクエリを加速し、ユーザーがどこから接続しているかにかかわらず、遅延を劇的に低減するサービス。
- Docker Debug:コンテナ化されたアプリケーションのローカルおよびリモートデバッグのための統合ツールボックス。このツールは、コンテナ内でのデバッグを効率的に行うために、任意のデバッグツール群を一括して導入することができる。
- Next-Generation Docker Build:コンテナのビルドプロセスを大幅に高速化する新しい機能。この新しいビルドシステムは、クラウドを活用してビルドプロセスを助け、従来のビルド時間を大幅に短縮する。
- Docker AI:開発者がコードを書く際にリアルタイムでヘルプを提供し、Dockerfileのエラーを修正する手助けをする。
- Docker Compose Watch:開発者がコードを編集して保存すると、実行中のDocker Composeサービスを自動的に更新するプロセスを自動化するもの。
2023/10/15のピックアップ
今日の気になる用語
- Unreal Engine:Epic Gamesによって開発された、業界をリードするゲームエンジン。
- Learning Agents:Unreal Engine (UE)のプラグインで、強化学習や模倣学習を通じてNPCの行動を訓練する。
- RWKV(Raven’s World-Knowledge Vectors):RNN(Recurrent Neural Network)をベースにしたモデルで、トランスフォーマーのような大規模言語モデル(LLM)と同等の性能を持っている。GPT(Generative Pretrained Transformer)のように直接トレーニングすることができ、並列化が可能。これにより、RNNとトランスフォーマーの両方の利点を組み合わせている。
- RWKV-4-World-JPNtuned:「RWKV」の日本語版で、学習データやトークナイザーが日本語用にチューニングされている。
- DVC(Data Version Control):データサイエンスと機械学習プロジェクトのためのバージョンコントロールシステム。データとモデルのバージョン管理、データパイプラインのトラッキング、実験の履歴の管理を行う。
今日の気になる記事
【LLM・生成AI】
2023/10/15 オープンソース最強日本語対応LLM、RWKV-4-World-JPNtunedをGoogleColabで試す!!
【AI・データ分析】
2023/10/15 Unreal EngineのLearning Agentsプラグインで車が自走するまで
2023/10/15 DVCでのデータの登録を複数人で行う場合の注意 ー 手順を間違えるとデータを失える ー
2018/12/13 Data Version Control(DVC)でデータ分析のモデル作成を再現可能にする
【IT・AIの活用と未来】
2023/10/15 炭化したパピルス巻物内の単語をAIモデルで解読 「ベスビオ火山チャレンジ」で初の賞金
【サービス作ってみた】
2023/10/15 AWSの構成図をChatGPT(GPT-4V)に読み込ませてIaCコードを生成してみた
【その他】
2023/10/15 iCloudやGoogleドライブなど複数のクラウドストレージやデバイスのファイルを一括管理できるファイルマネージャー「Spacedrive」のアルファ版が公開される
2023/10/14のピックアップ
今日の気になる用語
- Meta Quest 3:Metaによる最新のVRヘッドセットで、40%スリムなビザー、高解像度、強化された3D空間オーディオ、Qualcomm Snapdragon XR2 Gen 2チップセットなどを特徴とする。改善されたMixed Reality機能と新しいコントローラーも搭載し、ゲームや複合現実体験を提供する。
- Meta QuestのMesh API:物理的な世界を3Dメッシュで再構築し、そのメッシュデータにアクセスすることを可能にする。具体的には、Mesh APIを使用すると、物理世界をメッシュで再構築した「Scene Mesh」にアクセスできる。
- Meta Quest Depth API:デベロッパーがバーチャルリアリティ(VR)コンテンツを作成する際に、物理的な環境の深さ情報を利用できるようにするAPI。このAPIは、デバイスのセンサーから取得したデータを使用して、ユーザーの物理的な環境におけるオブジェクトの深さや位置を把握する。
- Cloudflare:ウェブサイトの速度とセキュリティを向上させるクラウドプラットフォーム。CDNサービス、DDoS防御、安全なDNSを提供し、ウェブトラフィックを効率的かつ安全に管理する。
- Cloudflare Workers:Cloudflareのエッジネットワーク上でコードを実行するサーバーレスプラットフォーム。開発者は、ユーザーに近い位置でコンテンツを動的に最適化し、APIをルーティングし、セキュリティルールをカスタマイズし、リアルタイムのアナリティクスを提供することができる。
今日の気になる記事
【LLM・生成AI】
【LLMをはじめとした生成AIの技術】
2023/10/14 LLM推論のパフォーマンスエンジニアリング:ベストプラクティス
【データ基盤】
2023/10/14 24時間365日動き続けるデータシステムの設計手法 : 「データ指向アプリケーションデザイン」実践編
【AI・データ分析】
2023/10/14 GCPとDockerでKaggle環境を作る(2023年10月現在)
【IT・AIの活用と未来】
2023/10/14 現状の生成AI技術に関する、利用者、運用者、行政・立法、開発・研究者へのSF作家クラブの提言
【作ってみた・試してみた】
2023/10/14 Openai api :prompt engineering VS fineturning 【Kaggle】
2023/10/14 Cloudflare Workers で OpenAI の LINE Chatbotを作ってみた
2023/10/14 Amazon BedrockとStreamlitで簡単チャットアプリを作成する方法
2022/1/27 Hono[炎]っていうイケてる名前のフレームワークを作っている
【Amazon Bedrock】
2023/10/14 Amazon Bedrock で使用できるモデル(LLM)仕様を比較・整理してみた
2023/10/14 Amazon Bedrockのトークン数の確認方法
【Meta】
2023/10/14 Mesh API と Depth API による Meta Quest 3 のMRエクスペリエンスの構築
2023/10/14 Meta Quest 3 アプリ開発ガイド
2023/10/14 Meta Quest Developer Hub の使い方
【Microsoft】
2023/10/14 MicrosoftがActivision Blizzardの買収をついに完了
【その他】
2023/10/14 徹夜による睡眠不足はカフェインや仮眠で穴埋めできるのか?
2023/10/14 身長と体重だけで求めるBMIは肥満を表わす数値には向いていない、ではどうやって肥満を示すべきなのか?
2023/10/13のピックアップ
今日の気になる用語
- RAG (Retrieval-augmented Generation):情報検索とテキスト生成を組み合わせ、事実を検証しながらより正確なテキスト回答を生成する技術。
- Elasticsearch:オープンソースの分散型検索エンジンであり、大量のデータをリアルタイムに迅速に検索し、分析することができる。Luceneを基盤としており、テキスト、数値、地理空間、構造化、非構造化データなど、多様なタイプのデータをサポートしている。
- SGE(Search Generative Experience):Googleが開発した検索体験を強化するための新しい実験的な機能で、生成AIを使用している。ユーザーがテキストプロンプトを使用して画像を生成したり、テキストベースのクエリに対してより詳細で具体的な回答を生成したりすることができる。
- ファウンデーション・モデル(基盤モデル):機械学習と人工知能(AI)の分野で用いられる用語で、大規模なプレトレーニング(事前学習)を行った後、特定のタスクやアプリケーションに対してファインチューニング(微調整)を行うことで、多くの異なるタスクやアプリケーションに適用可能なモデルを指す。
- AI TRiSM:Gartnerによって開発されたフレームワークで、AIのガバナンス、信頼性、公平性、信頼性、堅牢性、効果性、およびデータの管理を確保することを目的としている。
- Gartner:情報技術(IT)に関するリサーチとアドバイザリーサービスを提供する世界的な企業。
- Docker Compose Watch:開発者がコードを編集して保存すると、実行中のDocker Composeサービスを自動的に更新するプロセスを自動化するもの。
- pingouin:Pythonで使用できる統計ライブラリであり、主に統計解析と可視化を目的としている。
- Flappy:プロジェクトにおけるAI統合を単純化することを目的とした、本番環境での使用を前提とした言語学習モデル(LLM)アプリケーション/エージェントSDK(Software Development Kit)。
- ICCV (International Conference on Computer Vision):コンピュータビジョンに関する国際的な学術会議。
今日の気になる記事
【LLMをはじめとした生成AIの技術】
2023/10/13 LLMエージェントは同調圧力に弱く考えに固執する傾向があるため、ディベートでバイアスを和らげるのが重要との報告。導入ツールも公開
2023/10/12 Flappy:AI統合を単純化するための言語学習モデル(LLM)エージェントSDK
【RAG】
2023/10/13 ElasticsearchでRAG (Retrieval Augmented Generation) を試す
2022/3/19 はじめての Elasticsearch
【AI・データ分析】
2023/10/13 統計ライブラリ pingouin で多変数パラメトリック検定
2020/11/1 統計解析パッケージPingouinを使ってみる
2023/10/13 ICCV 2023速報
【IT・AIの活用と未来】
2023/10/13 内閣府、広報に“VTuber”起用 宇宙開発利用大賞のPRキャラに「宇推くりあ」が就任
2023/10/13 「生成AIのハイプ・サイクル」2023年版をガートナーが公開 LLMやプロンプトエンジニアリングは「過度な期待のピーク」に
2023/2/27 基盤モデル(Foundation Model)とは?
2023/2/6 AI TRiSMとは?DX推進に向けて押さえておくべきトレンド
2023/10/13 LINEヤフー、エンジニア業務に「GitHub Copilot」導入 対象者7000人 コーディングを最大2時間削減
【サービス作ってみた】
2023/10/13 ChatGPTを利用して画面モックを爆速で作成する
2023/10/13 【RAG】Amazon BedrockとConnect、Kendraを利用し、社内情報や社外の最新情報などの取り込んだデータをもとに回答するコールセンター向けAIチャットボットを構築してみた
【Google】
2023/10/13 Google、検索フォームからAI生成画像 文章の下書き依頼も
2023/10/13 Google検索バーからAI画像を生成できる「Search Generative Experience」が登場
2023/10/13 Google、生成AIによる著作権訴訟リスクで企業顧客に補償
2023/10/12 Google Cloud の IDaaS「Identity Platform」で作る、さまざまな認証パターン
【Amazon】
2023/10/13 アマゾンの衛星インターネット「Project Kuiper」試験衛星の打ち上げに成功
2023/10/13 AWS、MariaDBの最上位スポンサーになったと発表。なぜMariaDBの大口スポンサーに?
【その他の会社】
2023/10/13 移動家具ロボ「カチャカ」、LLM対応 ”リビング、ゴミ”でも命令理解
Preferred Robotics(PFRobotics)は、大規模言語モデル(LLM)を利用したスマートファニチャー・プラットフォーム「カチャカ」の新機能のデモを10月17日から幕張メッセで開催されるCEATEC 2023で先行公開する。自然言語での柔軟な操作を可能にする機能とされ、2024年春のリリースを目指して現在開発中のもの。
2023/10/13 CTC、rinnaと協業 企業専用生成AIの構築支援を拡充
伊藤忠テクノソリューションズ(CTC)は10月13日、コミュニケーションAI「りんな」を提供するrinnaと協業すると発表した。rinnaが開発した日本語特化の大規模言語モデル(LLM)や周辺技術をベースに、共同で各企業の専用生成AIのサービス開発に着手する。
【開発関連技術】
2023/10/13 cdnjs とは (ちょっと、調べてみました)
2023/10/13 Docker Compose Watchのすすめ
2023/10/13 DockerがWebGPUを用いてGPUを抽象化、AI処理などGPUを使ったコンテナ化アプリのポータビリティを実現する技術を開発中。DockerCon 23
【科学・技術】
2023/10/13 人間の神経や骨格と結び付いて思い通りに操作可能&幻肢痛も軽減できる画期的な義手が開発される
【データコンペ】
2023/10/13 Lq Lossを使ったnishika中古マンション価格予測コンペ 2023夏の部 3位解法
2023/10/8 第4回 Data-Centric AI勉強会 -コンペLT大会-
2023/10/12 CommonLitコンペで学んだこと
【その他】
2023/10/13 WordPressに新たな管理者アカウントを作成してサイトを乗っ取るマルウェアが出現
2023/10/13 大手半導体メーカーのQualcommが全従業員の2.5%に相当する1200人超の従業員を解雇する予定
2023/10/13 キヤノン、5nm対応で消費電力が10分の1になる半導体製造装置を発売
2023/10/13 Appleとカリフォルニア工科大学の7年続いた法廷闘争がついに決着
2023/10/12のピックアップ
今日の気になる用語
- BERT4Rec:推薦システムにおいてユーザーの動的で進化する嗜好をその歴史的な行動からモデリングすることを目的とした手法で、BERTを利用したシーケンシャル(順序を持った)推薦を行う。
- LLaVA-1.5:ウィスコンシン大学とMicrosoftによって開発された、視覚と言語を効果的に結びつけるLarge Multimodal Models (LMM)の一つ。簡単な修正を加えることで、11のベンチマークで最先端の結果を達成。このモデルはデータ効率が良く、1.2Mの公開データを使用して1日でトレーニングが可能。
- Knowledge Graph(知識グラフ):エンティティ(オブジェクト、コンセプトなど)とそれらのエンティティ間の関係を表現するグラフ構造のデータベース
- Docker Debug:コンテナ化されたアプリケーションのローカルおよびリモートデバッグのための統合ツールボックス。このツールは、コンテナ内でのデバッグを効率的に行うために、任意のデバッグツール群を一括して導入することができる。
- Next-Generation Docker Build:コンテナのビルドプロセスを大幅に高速化する新しい機能。この新しいビルドシステムは、クラウドを活用してビルドプロセスを助け、従来のビルド時間を大幅に短縮する。
- Docker AI:開発者がコードを書く際にリアルタイムでヘルプを提供し、Dockerfileのエラーを修正する手助けをする。
- Japanese StableLM Instruct Alpha v2:Stability AIによって開発された、7Bパラメータを持つ日本語の言語モデル。このモデルは、指示応答(Instructive Response)タスクに特化しており、ユーザーからの指示や質問に対して詳細な回答を生成することができる。商用利用が可能。
- 小惑星ベンヌ:地球に近い軌道を持つ小惑星で、太陽系の初期の成分を保存しているとされる。
- NASAの探査機「オシリス・レックス」:NASAの探査機で、小惑星ベンヌからサンプルを採取するミッションを担っている。採取したサンプルを地球に持ち帰った。
今日の気になる記事
【LLM・生成AI】
2023/10/12 Google Colab で Japanese StableLM Instruct Alpha v2 を試す
【LLMをはじめとした生成AIの技術】
2023/10/12 LLMが真の推論能力を発揮するには時折「一時停止」させるのが重要との報告
本研究は、一時停止トークンという新しい手法を導入することでLLMに追加で計算を行わせ、推論を深めさせることに成功しています。本記事ではその詳細をご紹介します。また、プロンプトを工夫することで、一時停止トークンのような効果を模倣する可能性も考察しました。一般のユーザーも高度なプログラミングスキルや専門的な知識なしに、LLMの性能を向上させることができるかもしれません。さらに記事の最後では、人間の挙動との類似性にも触れました。
2023/10/12 N番煎じでLLaVA v1.5をDatabricksで試す
【LangChain】
2023/10/12 Langchainを使用したKnowledge Graphの構築と質問応答
20219/6/27 Knowledge Graph とはなにか
【LlamaIndex】
2023/10/12 Tips for LlamaIndex
【データ基盤】
2023/10/12 「クラウド時代のデータ活用基盤!最新動向と応用を徹底解説」でModern Data Stack界隈で注目されている4つの分野について話しました
【AI・データ分析】
2023/10/12 自動運転AI開発:学習からシミュレーション、実車テストまで
【IT・AIの活用と未来】
2023/10/12 「みんなにめちゃめちゃ嫌がられた」 “データドリブン行政”に向け庁内のあらゆるデータを棚卸 三重県のDX担当者に聞く苦悩と希望
【サービス作ってみた】
2023/10/12 Bedrock で画像を生成する仕組みを LINE ボットに組み込んでみた
【Apple】
2023/10/12 Appleは「Google検索を採用する代金」としてGoogleから年間3兆円を受け取っている
【OpenAI】
2023/10/12 OpenAIが2023年11月に開発者向けの大規模なアップデートを実施か
2023/10/12 【初投稿】ChatGPTを最強にするはじめの一歩 〜 OpenAI API + LangChain 〜
【Microsoft】
2023/10/12 MicrosoftがVBScriptを段階的に廃止へ、マルウェアの配信をブロックするため
2023/10/12 Microsoftが国内初のAI・IoT拠点、企業のデジタル化支援
【その他の会社】
2023/10/12 会話ロボ「Romi」、LLMで会話力アップした独自AI
2023/10/11 LLMの開発は難しい?簡単?Stability AIの現場から (2023/10/11, W&B Fully Connected)
【開発関連技術】
2023/10/12 [レポート]最新の脅威に対応するために ”今” 必要なクラウドのセキュリティ対策 – AWS Security Forum Japan 2023 #aws #awssecurity
2023/10/12 Dockerがコードネーム「Docker Debug」発表 コンテナ内に任意のデバッグツール群を一括導入、効率的なデバッグを実現
2023/10/12 Docker、ビルドを約40倍高速にする次世代のDocker Buildを開発中 Mastodonのビルドが2時間25分→3分40秒に
2023/10/12 生成AIがDockerを使った開発の質問に答えてくれる「Docker AI」発表、Dockerfileのエラーなども修正。VSCode対応。DockerCon 23
【科学・技術】
2023/10/12 NASAの探査機が回収した小惑星「ベンヌ」のサンプルに生物に不可欠な炭素と水が豊富に含まれていたことが明らかに
2023/10/12 脳を3Dプリンタで印刷、原料はヒトの細胞 マウスの脳に移植し正常に機能 英オックスフォード大が開発【研究紹介】
2023/10/12 切れた神経を再びつなぎ合わせることが可能な物質の開発に成功
【教育・マネジメント】
2023/10/12 人事評価制度の公開ふりかえり
2023/10/12 LINEヤフーがリスキリング本格展開 未経験からITエンジニアに「テックアカデミー」
【その他】
2023/10/12 全銀ネット 遅れ出ていた振り込み処理もすべて完了 運営団体
2023/10/12 「修理する権利」を認める法律にカリフォルニア州知事が署名し2024年7月1日からカリフォルニア州で施行
2023/10/12 日立の人:データ分析の世界大会で3位 生涯現役めざすデータサイエンティスト
2023/10/11のピックアップ
今日の気になる用語
- LLaVA-1.5:ウィスコンシン大学とMicrosoftによって開発された、視覚と言語を効果的に結びつけるLarge Multimodal Models (LMM)の一つ。簡単な修正を加えることで、11のベンチマークで最先端の結果を達成。このモデルはデータ効率が良く、1.2Mの公開データを使用して1日でトレーニングが可能。
- AMD:ファブレス(製造設備を持たない)半導体企業で、高性能コンピューティングとグラフィックス製品を提供。主にCPUとGPUを開発。
- Nod.ai:人工知能(AI)と機械学習(ML)システムの企業で、未来のAIシステムのための主要なオープンソース技術を提供。チップメーカーのAMDが買収。
- Adobe Firefly:画像生成、テキスト効果、ベクター用の生成AIモデルを基盤としており、100以上の言語のテキストプロンプトをサポート。商用利用も可能で、Adobe Expressを通じて「テキストから画像生成」や「テキスト効果」などの機能が利用できる。
- PaLM2:Googleが2023年5月に発表したLLM。Google CloudのVertex AIでは、PaLM2とともにコード生成・補完モデルのCodeyも利用可能。
- GA4(Google Analytics4):Googleが開発したウェブサイトとアプリの両方からイベントベースのデータを収集する次世代のアナリティクスツール。2020年10月にリリースされたGA4は、ユーザー行動をより深く計測することができるのが最大の特徴。
- Microsoft Clarity:Microsoftが開発した無料のユーザー行動分析ツール。ユーザーがウェブサイト上でどのように行動しているかを分析し、そのデータをほぼリアルタイムで表示できる。
- Databricks:データウェアハウスとデータレイクの利点を統合したレイクハウスアーキテクチャを提供する米国企業。このプラットフォームでは、データ、分析、AIを単一の場所で効率的に管理・分析できる。
- Stable Diffusion XL:Stability AIによって発表された、テキストから画像を生成するための先進的なパッケージソフトウェア。モデルの微調整がより容易になった。
- Fooocus:Stable Diffusion XL (SDXL)のテキストから画像へのAIアートジェネレーションを簡略化し、最適化するために設計されたユーザーインターフェース。
- Colab AI:Google Colab上でコーディング支援を行うAIツール群で、2023年10月現在ではGoogle Colab Pro+のユーザーにのみ提供されている。提供されているAIツールには、AIによるオートコンプリート、自然言語によるコード生成、チャットボット、エラーの説明などが含まれる。
- Cloudflare:ウェブサイトの速度とセキュリティを向上させるクラウドプラットフォーム。CDNサービス、DDoS防御、安全なDNSを提供し、ウェブトラフィックを効率的かつ安全に管理する。
- Cloudflare Hyperdrive:既存データベースへのクエリを加速し、ユーザーがどこから接続しているかにかかわらず、遅延を劇的に低減するサービス。
今日の気になる記事
【LLM・生成AI】
2023/10/11 Adobeの画像生成AI「Firefly」のAIモデルが「Firefly Image 2 Model」など3モデルにアップデート、人間のレンダリングが向上しよりリアルな表現が可能に
2023/10/11 イラレの生成AIが凄いので Live – 2023/10/11 Adobe MAX 2023
2023/10/11 ブラウザ版「Illustrator」、β版を一般公開 テキストからベクター画像を生成するAI機能も搭載へ
2023/10/11 画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。便利な新機能が大量に出たのでまとめて紹介します
【LLMをはじめとした生成AIの技術】
2023/10/11 画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い
2023/10/11 LLaVA
【データ基盤】
2023/10/11 DatabricksレイクハウスAIでLlama 2基盤モデルが利用可能に
2023/10/11 CDNレイヤでDBのコネクションプーリングとクエリキャッシュを提供。世界中どこからのDBアクセスでも高速化する「Hyperdrive」、Cloudflareが提供
【AI・データ分析】
2023/10/11 ついに強化学習を体験してみる備忘録
2023/10/11 GA4 と Microsoft Clarity で定量と定性分析の間で旅をする
【IT・AIの活用と未来】
2023/10/11 日本主導による「ドローン衝突回避」の国際規格
【サービス作ってみた】
2023/10/11 Google製LLM PaLM2と対話できるLINE_Botを爆速開発ハンズオン
【Google】
2023/10/11 Google ColaboratoryにAIが搭載されたから使ってみた!スゴい!!!
【その他の会社】
2023/10/11 AMDがAIソフトウェア開発企業のNod.aiを買収、NVIDIAに対する競争力強化の狙いか
【開発関連技術】
2023/10/11 「Google Chrome 118」安定版リリース、CSSのスタイルルールの適用範囲を限定できる「@scope」をサポート
【教育・マネジメント】
2023/10/11 【EMの業務解剖】事業タイプ別、評価制度を整える際に押さえるべきポイントを解説。最も重要なことは企業と社員の間の納得感。
2023/10/11 Google Cloud、生成AIを無料で学べる「The Arcade」公開 ゲーム感覚でポイントを稼ぎ、賞品も獲得可能
2023/10/11 チーム・組織デザインの良し悪しはプロダクト開発フローの効率を左右する
【その他】
2023/10/11 22年前からFirefoxブラウザに存在したバグ、23歳の初心者プログラマーが修正
2023/10/11 Googleアカウントで「パスキー」認証がデフォルトに、パスワードレスがさらに加速
2023/10/11 ピクシブの機械学習基盤 (PIXIV MEETUP 2023版)
2023/10/11 「全銀ネット」障害2日目、復旧のめど立たず 11行で振込遅延
2023/10/11 高額家電は値引き不可? パナ・日立が進める「指定価格制度」とはなにか
2023/10/11 Google、Cloudflare、Amazon、 HTTP/2悪用の史上最大規模DDoS攻撃について説明
2023/10/10のピックアップ
今日の気になる用語
- Vertex AI Search:Google Cloudのエンタープライズ検索ソリューションで、テキスト検索、自然言語処理、機械学習を活用し、カスタム検索エンジンの構築とカスタム検索アルゴリズムによる情報取得を可能にする。
- Vertex AI:Google Cloudの機械学習(ML)およびディープラーニング(DL)プラットフォームで、データの簡単な準備からトレーニング、デプロイメント、監視までのMLワークフローを効率的にサポートする。AutoML機能も充実。
- streamsync:オープンソースのデータアプリケーションフレームワークで、Streamlitの代替として機能するが、Streamlitと比較して大幅に高速化されている。
- RAG (Retrieval-augmented Generation):情報検索とテキスト生成を組み合わせ、事実を検証しながらより正確なテキスト回答を生成する技術。
- Retrievalフェーズ:情報検索や自然言語処理のコンテキストで使われる用語で、特定の情報やデータを検索する段階
- Amazon Kendra:AWSの高度な情報検索サービスで、自然言語処理を使用し、多様なデータソースから関連情報を高速に抽出できる。
- Linter:コード品質を向上し、一貫性を維持するためのツールで、ソースコード内のエラーやスタイルの違反を検出し、開発者に指摘する。
- Formatter:コードの自動整形を担当するツールで、コーディングスタイルの一貫性を保ち、可読性を向上させる。
- Flake8:Pythonのコード品質とスタイルをチェックするためのLinter。Pythonコードの静的解析を行い、コーディング規約(PEP 8)、コーディングスタイルの一貫性、および潜在的なバグを検出する。
- Pylint:Pythonコードの静的解析ツールLinterで、コード品質の評価、コーディング規約のチェック、およびバグ検出を行う。Flake8と同様の役割を果たすが、より詳細な解析を提供する。
- isort:Pythonコード内のインポート文を整理・整形するためのFormatter。
- Black:Pythonコードを自動的に整形するFormatterで、コードの一貫性を保ち、PEP 8に準拠するように整形する。
- Ruff:特定のPythonパッケージやモジュールの品質やセキュリティに関する情報を提供するツール。Pythonコードのスキャンと分析を行い、セキュリティ上の脆弱性、コーディング規約に違反したコード、一貫性の問題、潜在的なバグなどを検出する。
- dbt (data build tool):データウェアハウス内のデータを効果的に変換するためのオープンソースツールで、SQLでデータモデリングを行い、バージョン管理、ドキュメンテーション自動化、テストの統合などをサポートしている。
- AutoGen:Microsoftが開発した大規模言語モデル(LLM)ワークフローを簡素化するフレームワークで、カスタマイズ可能で対話可能なエージェントを提供する。
今日の気になる記事
【LLM・生成AI】
2023/10/10 賢いと噂の日本語LLM「ELYZA」をウェブAPIで使う! Power Automateなどからも呼び出せる完全ローカル環境の構築
【LLMをはじめとした生成AIの技術】
2023/10/10 LLMは「物事がどのように位置づけられ、時間がどのように進行するか」を理解する世界モデルを持つ可能性
言語モデルの進化は、単なるテキスト生成から、より高度な「理解」へとシフトしています。今回行われた研究では、大規模言語モデル(LLM)が単に次のテキストを生成するための統計(確率)を計算しているだけでなく、物事がどのように位置づけられ、時間がどのように進行するかを「理解」している可能性が新たに示されました。なお、本研究は野心的なテーマに挑んでいるため、大きな命題に対する断定的な結論が得られているわけではありません。しかし、それでも一見の価値がある報告内容となっています。
【RAG】
2023/10/10 Amazon KendraとAWS Lambdaを使い、RAGのRetrievalフェーズを試してみた
2023/10/10 Amazon BedrockのClaudeとAmazon Kendra、AWS Lambdaを利用し、RAGを実装してみた
2023/9/26 Search-Askメソッド (あるいは Retrieval Augmented Generation) で GPT の回答精度を上げてみる
【Function Calling】
2023/10/10 OpenAI の関数呼び出し (Function Calling) 機能を使って Oracle Cloud Infrastructure のメトリクスを自然言語で問い合わせてみる
【AI・データ分析】
2023/10/10 ニューラルネットワークの中身を分割してAIの動作を分析・制御する試みが成功、ニューロン単位ではなく「特徴」単位にまとめるのがポイント
GoogleやAmazonが投資するAIスタートアップのAnthropicの研究チームが、ニューラルネットワークがどのように言語や画像を扱っているのかを解き明かす研究において、個々のニューロンを「特徴」と呼ばれる単位にまとめることでニューラルネットワークの中身を解釈しやすくなるという研究結果を発表しました。
2023/10/10 GPT-3.5に画像分類タスクを解かせる
2023/10/10 Streamlitのパフォーマンスに対処するフレームワークStreamsyncについて
2023/5/6 Streamlit代替となる、データアプリを作成するためのオープンソースのフレームワーク・「Streamsync」
2023/10/10 dbtの”Analyses and Seeds”コースを受講してみた
【IT・AIの活用と未来】
2023/10/10 三井不動産が“社内ChatGPT”利用開始 従業員2500人に展開
2023/10/10 45億個のワクチン製造で数百人のスタッフ育成が急務に、ファイザーが解決策に「VR」を選んだ理由とは
2023/10/10 23歳のAIBO、“引き際”はどこに 「ロボット死なない問題」などを3人の有識者が議論
2023/10/10 チャットGPT進化でも残る、セキュリティ/プライバシー問題
【サービス作ってみた】
2023/10/10 FlutterとPyTorchモバイルで画像AIアプリを作る
2023/10/10 [個人開発] 簡単な日本語を入力するとAIがイケてる画像を生成するサービスをリリースするまで
2023/10/10 FlaskとOpenAI APIで構築:効率的なメール作成アシスタント
【Google】
2023/10/10 Googleが生成AIを使用してさまざまなデータソースを横断的に検索できるVertex AI Searchの医療関係者向けの新機能を発表
【OpenAI】
2023/10/10 ChatGPTのアプリ収益が月間6億8000万円に到達するも伸びは鈍化
【Microsoft】
2023/10/10 Microsoftはコード補完AIツール「GitHub Copilot」でユーザー1人あたり月額3000円近くの損失を出しているという報告
2023/10/10 AutoGenの論文
【その他の会社】
2023/10/10 ヨーロッパ初のエクサスケール・スーパーコンピューター「Jupiter」はx86ではなくArmコアで動作することが明らかに
【開発関連技術】
2023/10/10 【Python】Linterとして選ばれたのは「Ruff」でした
2021/7/15 Linter(リンター)とは何か?
2023/5/15 フォーマッターとは?コード整形の基本概念をわかりやすく解説する
2023/10/10 CSSの新しいプロパティ「form-sizing: content;」が便利! フォームのサイズを入力された文字量に合わせて自動変更
【科学・技術】
2023/10/10 AirPodsで脳信号を記録──イヤフォンに貼るセンサーを米研究者らが開発 ストレスや集中度を監視
2023/10/10 スマホでの録音を無効化するツール、中・米の研究者らが開発 部屋内での会話を収録不可
2023/10/10 スカイドライブとスズキ、「空飛ぶクルマ」年間100機量産へ
2023/10/10 Meta Quest 3は前世代のQuest 2から何が大きく変わったのか?見た目や装着感を比較してみたレビュー
2023/10/9のピックアップ
今日の気になる用語
- Promptbreeder:特定のドメインでプロンプトを進化させて適応させる自己改善メカニズムで、タスクプロンプトの変異と評価を通じてプロンプトの改善を促進する技術。
- 構造方程式モデリング(Structural Equation Modeling, SEM):複数の変数間の関係を同時に考慮しながら、変数間の因果関係や相互作用を分析するための統計的手法。
- Alembic:SQLAlchemyの作者によって書かれたデータベースマイグレーションツールであり、テーブルや他の構造の変更をデータベースに反映するためのALTER文を発行する機能を提供する。
- SQLAlchemy:SQLAlchemyは、Python言語用のSQLツールキットおよびObject Relational Mapping (ORM) システムで、データベースとの対話をより効率的かつ簡単に行うことができる。
- LangChain:言語モデルを利用したアプリケーションの開発を支援するフレームワークであり、このフレームワークを使用することで、言語モデルを他のデータソースに接続し、言語モデルとの相互作用を可能になる。
- stable-baselines3:OpenAIが開発したPyTorchを使用して強化学習アルゴリズムの信頼できる実装を提供するセット。
- Colab AI:Google Colab上でコーディング支援を行うAIツール群で、2023年10月現在ではGoogle Colab Pro+のユーザーにのみ提供されている。提供されているAIツールには、AIによるオートコンプリート、自然言語によるコード生成、チャットボット、エラーの説明などが含まれる。
- Mistral AI:フランス・パリに拠点を置くAIスタートアップで2023年9月に新しいLLMであるMistral-7Bを発表。
- Mistral-7B:フランスのスタートアップMistral AIによって開発された新しい生成型AIモデルで、7十億のパラメータを持つ。
- LLaVA-1.5:Llama2をベースに画像入力を理解する能力をもたせたオープンソースの大規模マルチモーダルモデル(LMM)(OpenAIのGPT-4Vと類似)。
今日の気になる記事
【LLM・生成AI】
2023/10/9 Google Colab で Mistral-7B を試す
2023/10/9 Google Colab で LLaVA-1.5 を試す
【LLMをはじめとした生成AIの技術】
2023/10/9 プロンプトを遺伝的アルゴリズムで自動最適化するプロンプトエンジニアリング手法『Promptbreeder(プロンプトブリーダー)』
DeepMindによる最新の研究で、プロンプトエンジニアリングの新たな手法が発表されました。その手法は遺伝的アルゴリズムを用いてプロンプトを最適化するもので『Promptbreeder(プロンプトブリーダー)』と名付けられています。Promptbreederは、従来のCoT(ステップバイステップ)手法を上回る性能を持つとされています。プロンプトエンジニアリングの分野において、新たな可能性を切り開くかもしれません。
2023/10/9 Google Colab の Colab AI を試す
【LangChain】
2023/10/9 LLMアプリケーション開発のためのLangChain 後編⑤ 外部ドキュメントのロード、分割及び保存
2023/10/9 LLMアプリケーション開発のためのLangChain 中編④ Output parsers
【AI・データ分析】
2023/10/9 【実践】構造方程式モデリング
構造方程式モデリング(Structural Equation Modeling, SEM)は、統計学の手法の一種であり、複数の変数間の関係を同時に評価するために用いられる強力なツールです。SEMは、観測変数(測定された変数)と潜在変数(観測できないが仮想的に存在する変数)の間の関係をモデル化することができます。これにより、複雑な現象やシステムを統計的に理解しやすくなります。
2023/10/9 強化学習 keras-rl2からstable-baselins3への乗り換え
2023/10/9 第357話|データ分析の結果と実行の乖離: その原因と解決策
2022/8/20 Stable Baselines 3 入門 (1) – 強化学習アルゴリズム実装セット
【データ基盤】
2023/10/9 [Python] Alembicで複数に分割されたデータモデルの自動マイグレーションを実現する方法
2022/3/21 DBマイグレーションツールのAlembicの使い方
2021/8/14 SQLAlchemyの基本的な使い方 Python DB sqlalchemy
【IT・AIの活用と未来】
2023/10/9 生成AI共通ルール作りへ 米IT企業が安全性確保など協力の意向
【サービス作ってみた】
2023/10/9 Amazon BedrockとLangChainとAWS LambdaでLINEチャットボットを作成する
2023/10/9 [Amazon Bedrock] 簡単な下絵から、多数のイラストを自動生成してアイデアを膨らませる
2023/10/9 Line Messaging API を使う
2023/10/8 【個人開発】Pythonライブラリを開発からリリースまでしてみた感想と備忘録
2023/10/8 日常業務用にChatGPT(Azure OpenAI Service)とMicrosoft Teamsを連携する。
【その他の会社】
2023/6/14 Mistral AI、大規模言語モデルと生成AIでOpenAIに対抗するため1億1300万ドルのシードラウンドを確保
【教育・マネジメント】
2023/10/9 ベストプラクティスとの付き合い方
【一週間のまとめ】2023/10/2~2023/10/8
【LLM・生成AI】
- Stable LM3B:Stability AIが開発した30億パラメータを持つコンパクトで効率的な言語モデルで、携帯デバイスやラップトップで動作する。
- DreamGaussian:1枚の画像から高速で高画質の3Dコンテンツを生成するAIツールで、特に3D Gaussian Splatting技術を利用して効率的な3Dコンテンツ作成を支援する。
- STUDIO:直感的なUIと高い表現力を持つノーコードWeb制作プラットフォームで、ユーザーはコーディングなしで自由にWebデザインを行うことができる。
- ProPainter:シンガポールの南洋理工大学が開発した、動画内の指定した不要な動く物体を後から編集で消す技術。
- RealFill:Googleとコーネル大学が開発したAIで、複数の失敗写真を元にベストショットを後から作り出せる。
- Jurassic-2:AI21 Labsによる新世代の大規模言語モデルで、ゼロショット指示実行能力、低遅延、多言語対応を含む新しい機能を提供する。Amazon Bedrockで使用できる。
- Stable Diffusion:拡散モデルに基づき、テキストの説明に基づいて詳細な画像を生成する能力を持つディープラーニングモデル。また、「スタイル転送」を利用して訓練データセット内の画像のスタイルを模倣し、テキスト入力に基づいて対応する画像を生成することができる。
【LLMをはじめとした生成AIの技術】
- Flash Attention:自然言語処理タスクのための高効率なAttention機構。トークン間の依存関係を効果的に捉えることで、計算コストを削減しつつ、高いパフォーマンスを達成する。
- StreamingLLM:長いテキストや対話に対応する大規模言語モデルを効率的にデプロイするフレームワーク。有限の注意ウィンドウで訓練されたモデルを、無限のシーケンス長に一般化し、最大22.2倍の高速化を実現する。
- 逆転の呪い:大規模言語モデル(LLMs)の一般化の失敗を指し、”A is B”の形の文を学習したモデルが”B is A”という逆の関係を自動的に一般化できない現象。
- Suspicion-Agent:不完全情報ゲームにおいて効果的なプレイを実現するGPT-4ベースのエージェントで、「心の理論」を活用している。東大松尾研究室が開発。
- HuggingFace Transformers:自然言語処理(NLP)のための大規模なプレトレーニング済みモデルとトークナイザーのライブラリ。
- チャットモデルテンプレート:チャットボットや対話システムを構築する際の基本的なフレームワークや設計パターンを提供するテンプレート。
- MentalLLaMA:大規模言語モデルの推論能力を評価するベンチマークで、人間のような思考や推論の性能を測定・分析する。
- Japanese Simple-SimCSE:日本語テキストの意味的類似性を計算するためのモデル。Simple-SimCSEのアプローチを基に、日本語データで訓練されており、文の埋め込みを生成して類似性を計算する。
- RAG (Retrieval-augmented Generation):情報検索とテキスト生成を組み合わせ、事実を検証しながらより正確なテキスト回答を生成する技術。
- CoVe (Chain-of-Verification):言語モデルが生成する誤情報を減少させ、ドラフト回答を検証する質問を計画し、独立して回答して最終的な検証済み回答を生成する方法。
- CoT (Chain-of-Thought):題解決の一連の手順や中間的な推論ステップを通じて複雑な推論能力をAIに可能にするテクニック。
- ToT (Tree of Thoughts):CoTと古典的なツリー探索を組み合わせることにより、LLMの回答の質を上げる技術。
- AoT (Algorithm of Thoughts):CoTの派生系。大規模言語モデル(LLM)の推論能力を強化する技術で、アルゴリズム的推論パスを通じてLLMを推進し、複雑なタスクやクエリを効率的に処理しながら人間に似た推論を可能にする。
- MP (Metacognitive Prompoting):大規模言語モデル(LLM)が自己評価を行い、初期の判断を再評価して反省する(メタ認知を行う)ことで、より深い理解と推論能力の向上を促進する枠組み。
- LogiCoT(Logical Chain-of-Thought):既存のChain-of-Thought(CoT)フレームワークを発展させ、大規模言語モデル(LLM)が自らの論理的整合性をチェックし、推論能力を向上させるためのフレームワーク。
- ReConcile:複数の大規模言語モデル(LLM)エージェント間で「円卓会議」のような協議を行い、多様な意見と合意を形成することで、LLMの推論能力を向上させるフレームワーク。
- RE2 (Re-reading):大規模言語モデル(LLM)に質問文を2回読ませる手法で、これによりLLMの推論能力が向上することが報告されている。
- 拡散モデル:固定マルコフ連鎖を使用して潜在空間にマッピングし、データに徐々にノイズを追加する潜在変数モデル。DALL-E 2、Stable DiffusionそしてMidjourneyは拡散モデルを使用。
【AI・データ分析】
- XAI:AIモデルの判断根拠やプロセスを人間が理解しやすく説明する技術。
- PI (Parmutation Importance):特徴量の重要度を評価する手法。特徴量をシャッフルしてモデルのパフォーマンス変化を測り、各特徴量の寄与を定量的に把握する。
- BATrees (Born Again Trees):既存の決定木モデルを改善する手法で、初期モデルの予測誤差を利用して新しい木を生成し、性能を向上させる。
- PDP (Partial Dependence Plot):特定の特徴量が目的変数に与える影響を視覚化する手法で、特徴量の異なる値に対する平均的な予測値をプロットする。
- ICE (Indivisual Conditional Explanation):PDPを拡張し、個々のデータポイントに対する特徴量の影響を視覚化し、個別のケースにおける特徴量の影響を理解するのに役立つ。
- SHAP (Shapley Additive Explanations):機械学習モデルの予測に対する各特徴量の寄与を定量的に評価する手法。SHAP値はゲーム理論のShapley値に基づいており、特徴量の寄与が公平に割り当てられることを保証し、モデルの予測の解釈を容易にする。
- LIME (Local Interpretable Model-agnostic Explanations):任意の機械学習モデルの予測を解釈可能にする手法で、特定の入力に対するモデルの挙動を近似的に説明する。
【Microsoft】
- CodePlan:Microsoftが開発したソフトウェア開発プロジェクトの計画と管理を支援するツール。
- Deep Speed:Microsoftが開発した深層学習モデルの訓練を効率的かつ高速に行うためのライブラリ。
【OpenAI】
- GPT-4V:OpenAIによって開発されたマルチモーダルAIで、従来のテキスト処理能力に加えて、画像解析機能と音声出力機能を持つ。画像や音声を入力として受け取り、それに関連する情報や質問にテキストや音声で応答することができる。
【Amazon】
- Amazon Bedrock:APIを通じて基盤モデル(Foundation Models、FM)を利用できる完全マネージド型サービスで、これには大規模言語モデル(LLM)も含まれる。
- AWS Skill Builder:AWSが公式で公開しているオンライン学習サービス。
- Amazon Titan:AWSによって事前学習された基盤モデルで、テキスト生成や要約など多くの用途に利用できる。特に、Amazon Titan Embeddingsはテキストを数値表現に変換し、検索やパーソナライゼーションなどに利用可能。Amazon Bedrockで使用できる。
【Meta】
- M2M100:Facebook AIが開発した多言語間翻訳モデルで、100以上の言語間で直接翻訳が可能。従来の英語を中間言語とするアプローチではなく、任意の言語ペア間で効率的に翻訳を行い、高い翻訳精度を実現している。
【その他の企業】
- Claude2:Anthropicの最新のLLM。Amazon Bedrockで使える。
- Anthropic:元OpenAIエンジニアが立ち上げた非公開企業。GoogleやZoom、SK Telecomなどが出資。
【アプリケーション開発】
- Bun:JavaScriptとTypeScriptのための高速なオールインワンツールキットで、Node.jsの代替として設計されている。
【データ基盤・インフラ】
- dbt (data build tool):データウェアハウス内のデータを効果的に変換するためのオープンソースツールで、SQLでデータモデリングを行い、バージョン管理、ドキュメンテーション自動化、テストの統合などをサポートしている。
- オンプレクラウド:企業が自社のデータセンター内にプライベートクラウド環境を構築すること。
- Cloudflare:ウェブサイトの速度とセキュリティを向上させるクラウドプラットフォーム。CDNサービス、DDoS防御、安全なDNSを提供し、ウェブトラフィックを効率的かつ安全に管理する。
- Databricks:データウェアハウス・データレイクとAIを扱う米国企業。
- Snowflake:データウェアハウス・データレイクを扱うデータクラウド提供企業・サービス。
【科学技術】
- 量子ドット:サイズが極小の半導体ナノ粒子で、光を吸収し再放出する特性を持つ。そのサイズと形状により、放出する光の波長(色)を制御でき、ディスプレイやバイオイメージングに利用されている。
【その他】
- J-Quants:個人向けに金融データをAPIで配信するサブスクサービス。
- mixpanel:Webおよびモバイルアプリケーションのユーザーインタラクションを追跡するイベント分析サービスで、収集されたデータを用いてカスタムレポートを作成する。
2023/10/8のピックアップ
今日の気になる用語
- Embeddable Python:Pythonインタープリタを他のアプリケーションに埋め込むことができる形式を指す。これにより、アプリケーション内でPythonスクリプトを直接実行できる。
- Amazon Bedrock:APIを通じて基盤モデル(Foundation Models、FM)を利用できる完全マネージド型サービスGPT-4は使えないがAnthropicのClaude2を使用することができる。また、Amazon Titan、Jurassic-2、Stable Diffusionなども使用できる。
- Claude /Claude2:Anthropicが開発した無料のチャット型AIで、人間らしい会話能力が特徴。10万トークンに対応し、ChatGPTの3倍以上の容量で文書を迅速に読み分析できる。Claude2はAmazon Bedrockで使用できる。
- Amazon Titan:AWSによって事前学習された基盤モデルで、テキスト生成や要約など多くの用途に利用できる。特に、Amazon Titan Embeddingsはテキストを数値表現に変換し、検索やパーソナライゼーションなどに利用可能。Amazon Bedrockで使用できる。
- Jurassic-2:AI21 Labsによる新世代の大規模言語モデルで、ゼロショット指示実行能力、低遅延、多言語対応を含む新しい機能を提供する。Amazon Bedrockで使用できる。
- Stable Diffusion:拡散モデルに基づき、テキストの説明に基づいて詳細な画像を生成する能力を持つディープラーニングモデル。また、「スタイル転送」を利用して訓練データセット内の画像のスタイルを模倣し、テキスト入力に基づいて対応する画像を生成することができる。
- 拡散モデル:固定マルコフ連鎖を使用して潜在空間にマッピングし、データに徐々にノイズを追加する潜在変数モデル。DALL-E 2、Stable DiffusionそしてMidjourneyは拡散モデルを使用。
- Amazon Connect:クラウドベースのカスタマーサービスソフトウェアで、オムニチャネルクラウドコンタクトセンターとして機能する。
- Text generation web UI(1.6.1):利用者がブラウザ上で直接テキスト生成AIと対話できるインターフェース。
今日の気になる記事
【LLMの技術】
2023/10/7 Text generation web UI(1.6.1)の設定項目を調べてみた_modelタブ編
2023/7/19 「Text generation web UI」のインストール方法と使い方!大規模言語モデルを自分のPCで手軽に動かそう
2023/9/22 AnthropicのAIチャット「Claude 2」とは?概要や使い方を解説
【LangChain】
2023/10/8 LLMアプリケーション開発のためのLangChain 前編③ Language models
【生成AIの活用】
2023/10/8 Chat GPT-APIを使った解説つき英単語データベース+単語テスト
【Amazon Bedrock】
2023/10/8 Amazon BedrockのClaudeとAmazon Connectを利用し、電話で色々な質問に答えてくれるコールセンター向けAIチャットボットを構築してみた
【その他】
2023/10/8 Embeddable Pythonの使い方
Emddable PythonはWindowsのPCであれば、Pythonの実行環境を丸ごと1つのフォルダで配布できるもの。何らかの事情でexe化して配布できない場合に便利。
2021/11/10 超軽量、超高速な配布用Python「embeddable python」
2023/10/7のピックアップ
今日の気になる用語
- Automatic Prompt Engineer(APE):OpenAIが提供しているツールの一つで、プロンプトを自動的に生成・評価してモデルを改善する。
- Text generation web UI(1.6.1):利用者がブラウザ上で直接テキスト生成AIと対話できるインターフェース。
- LlamaIndex:LLMアプリケーションがプライベートまたはドメイン固有のデータを取り込み、構造化し、アクセスするためのデータフレームワーク。
- LlamaIndex.TS:LlamaIndex.TSは、LLMアプリケーションがプライベートやドメイン固有のデータを取り込み、構造化し、アクセスするためのTypeScript向けデータフレームワーク。
- Git Squash:複数のコミットを1つにまとめる操作で、履歴をシンプルに保ち、理解しやすくする。
今日の気になる記事
【LLMの技術】
2023/10/7 Automatic Prompt Engineer
2023/10/7 Text generation web UI(1.6.1)でLLMと会話する
2023/10/7 講義や会議など長時間にわたるムービーをChatGPTの力で時間ごとに要約してくれるツール「summarize.tech」使ってみたレビュー
【LangChain】
2023/10/6 LLMアプリケーション開発のためのLangChain 前編① 全体概要及び外部データの取り込み事例
2023/10/7 LLMアプリケーション開発のためのLangChain 前編② プロンプトトテンプレート
【LlamaIndex】
2023/7/26 LlamaIndexを触ってみた
2023/10/7 LlamaIndex.TS クイックスタートガイド
【AI・データ分析】
2023/10/7 Deep Learningフレームワークを作ってみたお話
【OpenAI】
2023/10/7 OpenAI の WebUI で つくよみちゃんの会話テキストデータセット の ファインチューニングを試す
【その他】
2023/10/7 心理学者に学ぶ「聞き上手になるためにやるべきこと/やってはいけないこと」とは?
2023/10/6 Git で複数のコミットを1つにまとめられる「スカッシュ」というテクニック
2023/10/6のピックアップ
今日の気になる用語
- MentalLLaMA:大規模言語モデルの推論能力を評価するベンチマークで、人間のような思考や推論の性能を測定・分析する。
- Amazon Athena:AWS上で直接S3バケット内のデータをクエリするためのサーバーレスインタラクティブクエリサービス。
- dbt (data build tool):データウェアハウス内のデータを効果的に変換するためのオープンソースツールで、SQLでデータモデリングを行い、バージョン管理、ドキュメンテーション自動化、テストの統合などをサポートしている。
- UiPath:企業が業務プロセスを自動化するためのロボットプロセスオートメーション(RPA)プラットフォームを提供する企業。
- オンプレクラウド:企業が自社のデータセンター内にプライベートクラウド環境を構築すること。
- モノレポ:複数のプロジェクトを一つのリポジトリで管理する開発手法。これにより、共通の依存関係の管理やプロジェクト間の変更の追跡が容易になる。
- Expressive Text-to-Image Generation:テキストの記述から対応する画像を生成する技術。
- CodePlan:Microsoftが開発したソフトウェア開発プロジェクトの計画と管理を支援するツール。
- Project Kuiper:Amazonが推進する衛星インターネットサービスで、全球規模で高速インターネット接続を提供する計画。
- Japanese Simple-SimCSE:日本語テキストの意味的類似性を計算するためのモデル。Simple-SimCSEのアプローチを基に、日本語データで訓練されており、文の埋め込みを生成して類似性を計算する。
- Python 3.12.0
- Release 2.0.0 stable | XGBoost
今日の気になる記事
【LLMの技術】
2023/10/6 XなどのSNSポストから精神状態を高精度に解析するLLM『MentalLLaMA(メンタルラマ)』
マンチェスター大学などの研究者によって、SNSのテキストから精神状態を高い精度で解析することができるオープンソースの大規模言語モデル(LLM)『MentalLLaMA(メンタルラマ)』が開発されました。
2023/10/6 画像生成AIでプロンプトのフォントサイズ・色・スタイル・脚注を反映して画像を調整する技術が登場
入力された文章(プロンプト)から画像を生成するAIの機能を「Text to Image」と呼びます。このプロンプトを、プレーンテキストではなくリッチテキストにして、フォントの大きさや色、スタイル、脚注を生成する画像に反映する技術「Expressive Text-to-Image Generation」を、メリーランド大学カレッジパークの研究者らが生み出しました。
【RAG】
2023/10/6 【Bedrock / Claude】AWSオンリーでRAGを使った生成AIボットを構築してみた【Kendra】
【Open Interpreter】
2023/10/6 Open Interpreterを使ってReactプロジェクトを自動生成してみた
【AI・データ分析】
2023/10/6 【強化学習】DreamerV2を解説・実装
この記事は自作している強化学習フレームワークの解説記事です。https://github.com/pocokhc/simple_distributed_rl
2023/9/26 Kaggleスコアアップセミナー~画像系コンペ入門[後編](2023/09/26)
これから画像系の Kaggle コンペに参加ようと考えている、企業の研究開発部門所属のエンジニア、大学研究室所属の学生の皆様にオススメの内容になっています。・画像系コンペ入門[前編]:https://news.fixstars.com/3535/・画像系コンペ入門[後編]:https://news.fixstars.com/3796/
2023/10/6 機械学習チームのモノレポ移行
2023/10/6 拡散モデルに至るまでの画像生成AIについて解説をしてみた
NTTドコモ サービスイノベーション部の中村です。普段の業務では画像認識に関する研究開発を行っています。今回は話題となっている画像生成について、社内勉強会にて発表を行いましたので、発表スライドとともにご紹介できればと思います。詳しくは埋め込みのslideshareからご覧になれます
【IT・AIの活用と未来】
2023/10/6 ChatGPTは「鉄の発明」よりも圧倒的にインパクトが大きい 経済崩壊レベルの「相当やばい現象」が起こり得る生成系AIの進化
経営学者・入山章栄氏がパーソナリティを勤める、文化放送「浜松町Innovation Culture Cafe(浜カフェ)」。さまざまなジャンルのクリエーターや専門家、起業家たちをゲストに迎え、社会課題や未来予想図などをテーマにアイデアやオピニオンをぶつけ合います。本記事では、株式会社COTEN代表取締役CEOの深井龍之介氏と株式会社フィラメントCCOの宮内俊樹氏が、生成系AIの進化がもたらす社会への影響について語りました。**前回の記事はこちら
2023/10/6 科学論文の「不正に操作された画像」を検出するAIツールはすでに人間を上回る精度だという研究結果
【Amazon】
2023/10/6 Amazon Athenaに対してローカル環境からdbtを使ってみた
2023/10/6 AWSの“オンプレクラウド”って実際どうなの? ラックを日本初導入したNTTコムに話を聞く
“オンプレクラウド”という言葉をご存じだろうか。クラウドの機能をオンプレミス環境でも使えるようにするサービスの総称のようなもので、自社の拠点内にあるサーバしか使えない決まりの企業でも、パブリッククラウドの機能をある程度使える点などが特徴だ。Azureで言えば「Azure Stack」、Google Cloudでいえば「Google Distributed Cloud」などが相当するが、最も有名なのはAWSの「AWS Outposts」だろう。7月には、NECも実証実験用の施設に導入している。
2023/10/6 Amazon、Starlink競合の「Project Kuiper」初衛星を10月6日に打ち上げ
【Amazon Bedrock】
2023/10/6 Amazon BedrockをPythonスクリプトから利用してみた
2023/10/6 【Bedrock / Claude】AWSオンリーでRAGを使った生成AIボットを構築してみた【Kendra】
【OpenAI】
2023/10/6 ChatGPT APIを利用したシステム構築 前編① モデル、トークン及びインプット内容の分類とチェック
2023/10/6 ChatGPT APIを利用したシステム構築 中編② インプットのプロセシングとアウトプットのチェック
2023/10/6 ChatGPT APIを利用したシステム構築 後編③ エンドツーエンドシステムの構築とアウトプットの評価
2023/9/26 【UiPath×OpenAI】開発者向けのプロンプトエンジニアリング① 前編 プロンプト文の原則と反復型開発
2023/9/26 【UiPath×OpenAI】開発者向けのプロンプトエンジニアリング② 中編 テキストの要約と推論
2023/10/6 【UiPath×OpenAI】開発者向けのプロンプトエンジニアリング③ 後編 テキストの変換と拡張
2023/10/6 【UiPath×OpenAI】開発者向けのプロンプトエンジニアリング④ 応用編 チャットボットの作成
2023/10/6 ChatGPTを開発するOpenAIが独自のチップ開発へ動いていると報じられる
チャットボットAIのChatGPTや画像生成AIのDall-Eを開発するOpenAIが独自の人工知能チップの開発を検討しており、さらには半導体企業の買収も視野に入れているとロイターが報じています。**Exclusive: ChatGPT-owner OpenAI is exploring making its own AI chips | Reuters https://www.reuters.com/technology/chatgpt-owner-openai-is-exploring-making-its-own-ai-chips-sources-2023-10-06/**
【Microsoft】
2023/10/6 Microsoft、日本のAIガバナンスに関するレポート公開 「日本のリーダーシップを多くの国が期待」
2023/10/6 リポジトリ全体のコーディング作業を一気に自動編集する生成AI「CodePlan」 米Microsoftが開発
Microsoft Researchに所属する研究者らが発表した論文「CodePlan: Repository-level Coding using LLMs and Planning」は、単なる一部のコード編集にとどまらず、リポジトリ全体のコーディング作業を計画的に自動編集するための大規模言語モデル(LLM)を使用したフレームワークを提案する研究報告である。
【ソフトウェア・アプリケーション開発】
2023/10/6 【超危険】【クラウドも】そのMySQLパラメータ設定、やべ〜〜〜〜かも
【科学・技術】
2023/10/6 女性ホルモンを常に計測する“指輪” 排卵や月経を正確予測 米カリフォルニア工科大学が開発
【教育・マネジメント】
2023/10/6 2週間の勉強でAWS Certified DevOps Engineer – Professionalに合格した方法
【その他】
2023/10/6 NotionのFAQをTipsとしてランダムでSlackに通知させるGAS作成をChatGPTに任せてみた
2023/10/6 ネコがのどを「ゴロゴロ」鳴らす仕組みがついに明らかに
2023/10/6 Weekly Kaggle News #199
Python 3.12.0 が 2 日に公開されました。f 文字列や型アノテーションの記法などに更新が入っています。
Release 2.0.0 stable | XGBoost 勾配ブースティング決定木「XGBoost」の v2.0.0 が 9 月 12 日に公開されました。「LightGBM」搭載されている機能を含め、さまざまな更新が入っています。
Japanese Simple-SimCSE 多様な日本語事前学習済みモデルを文埋め込み用にファインチューニングした実験結果のまとめ。関連コードや新規の学習済みモデルも公開されています。
2023/10/5のピックアップ
今日の気になる用語
- Suspicion-Agent:不完全情報ゲームにおいて効果的なプレイを実現するGPT-4ベースのエージェントで、「心の理論」を活用している。東大松尾研究室が開発。
- 小惑星ベンヌ:地球に近い軌道を持つ小惑星で、太陽系の初期の成分を保存しているとされる。
- NASAの探査機「オシリス・レックス」:NASAの探査機で、小惑星ベンヌからサンプルを採取するミッションを担っている。採取したサンプルを地球に持ち帰った。
- GPT-4V:OpenAIによって開発されたマルチモーダルAIで、従来のテキスト処理能力に加えて、画像解析機能と音声出力機能を持つ。画像や音声を入力として受け取り、それに関連する情報や質問にテキストや音声で応答することができる。
- 国産量子コンピューター「叡(えい)」:日本製の量子コンピュータで、量子ビットを用いた高速な計算能力を持つ。
- Assistant with Bard:Googleの生成AI「Bard」の機能をGoogleアシスタントに統合したもの。
- HuggingFace Transformers:自然言語処理(NLP)のための大規模なプレトレーニング済みモデルとトークナイザーのライブラリ。
- チャットモデルテンプレート:チャットボットや対話システムを構築する際の基本的なフレームワークや設計パターンを提供するテンプレート。
今日の気になる記事
【LLMの技術】
2023/10/5 ポーカーなど不完全情報ゲームを「心の理論」で上手にプレイするGPT-4ベースの『Suspicion(疑心)-Agent』松尾研など開発
GPT-4などのLLMをはじめとするAIは、多くのタスクで人間に匹敵する、あるいはそれ以上の性能を発揮しています。しかし、ポーカーなどの不完全情報ゲームにおいては、AIが高い性能を発揮することは容易ではありませんでした。この課題に対処するため、研究者らはGPT-4を基盤とした新しいエージェント『Suspicion-Agent(Suspicion:疑心)』を開発しました。このエージェントは、不完全情報ゲームにおいて、優れたプレイができます。このエージェントが他のAIモデルよりも優れている理由の一つは、”心の理論(Theory of Mind)”を活用している点です。
2023/10/5 n週連続推薦システム系 論文読んだシリーズ27週目: 事前学習済み言語モデルをNews Encoder部分に用いて、ニュース推薦の品質を向上させる論文を読んだ!(2021年)
• Pre-trained Language Model(PLM, 事前学習済み言語モデル)をニュース推薦モデルに組み込むことで、浅い言語モデルよりもニュース記事の特徴をより有効に表現できて、オンラインニュースサービスの推薦性能とUXを効果的に改善できたという話。
2023/10/4 HuggingFace Transformers の チャットモデルテンプレート を試す
チャットモデルのメッセージの書式は、モデルによって様々です。間違った書式を使用すると、モデルが混乱し、パフォーマンスが低下してしまうこともあります。「チャットモデルテンプレート」はこの問題の解決します。https://huggingface.co/docs/transformers/main/en/chat_templating
【IT・AIの活用と未来】
2023/10/5 AIを「空気の読めるパートナー」に NTTデータがインド企業と実証実験 ChatGPTで非定型業務を自動化
NTTデータ先端技術(東京都中央区)は10月5日、大規模言語モデル(LLM)を活用して非定型業務を自動化する実証実験を始めると発表した。自然言語処理技術を持つAlgoAnalytics(インド、マーラーシュトラ州)と共同で実施し、早期のサービス化を目指す。
【Google】
2023/10/5 Pixel 8だけじゃない、Googleイベントで発表の生成AI機能まとめ
**「Assistant with Bard」**AndroidおよびiOS端末で利用できる「Assistant with Bard」も発表された。名称の通り、GoogleのAIチャットボット「Bard」を「Googleアシスタント」に統合したものだ。テキスト、音声、画像で質問すると、Bardが対応する。GmailやGoogleドキュメントなどへのアクセスを許可すれば、メールの代筆なども可能になる。
【OpenAI】
2023/10/5 GPT-4V: 驚きを隠せない進化!凄すぎて笑いが止まりません!!!
画像解析機能が追加され、アップロードした画像を使った新たなタスクの実行が可能になってます。そして、それが凄すぎます
2023/9/26 GPT-4V(ision) System Cardをざっくり訳した
【その他の会社】
2023/10/5 サイバーエージェント、アニメ制作に生成AI活用 研究開発部門を新設
2023/10/5 Slack経由で使える“社内ChatGPT”が約20万円から セゾン情報システムズが導入支援を開始
【科学・技術】
2023/10/5 小惑星ベンヌからのカプセル開封、予想外の成果に驚き 米NASA
2023/10/5 量子コンピューター国産2号機、サービス開始 企業向け
2023/10/5 国産量子コンピュータ初号機、愛称は「叡」に 英語表記は“A” 理研が発表
2023/10/5 2023年9月は史上最も暑い9月だったことが判明、あまりの異常さに気候学者がSNSで「マジで気が狂ってる」とぶち切れ
2023/10/5 先史時代の彗星衝突が狩猟採集社会から農業への移行をもたらしたという研究結果が報告される
【教育・マネジメント】
2023/10/5 遊びながらAWSを学べる“AWSクエスト”日本語対応 クラウドで街を救うRPG プレイ無料
米Amazon Web Servicesが2022年にリリースした、遊びながらAWSについて学べるオンラインゲーム「AWS Cloud Quest」。同作が2023年10月5日までに日本語に対応した。
2023/10/5 隙間時間を活用してAWS Certified Solutions Architect – Professionalを一発で合格した 勉強法
【その他】
2023/10/5 ノーベル文学賞、ノルウェーのヨン・フォッセ氏に授与
2023/10/5 “鉄道育成”ゲームアプリ「ソダテツ」 JR西が今冬にリリース 実在車両200種類以上が登場
2023/10/5 「ネコは進化的に完璧」と進化生物学者が熱弁
2023/10/5 世界人口の減少に伴い発生する問題とは?
2023/10/5 ロシアが2024年3月からVPNサービスをブロックする予定だと報じられる
2023/10/5 【「スゴ本」中の人が薦める】AIの限界をAIが超え始めていることを実感できる5冊
- 『ヒトはなぜ笑うのか』マシュー・M. ハーレー 、レジナルド・B・アダムズJr.、ダニエル・C・デネット 著、片岡宏仁 訳 2. 『言語の本質』今井むつみ、秋田喜美 著 3. 『教養としてのAI講義』メラニー・ミッチェル 著、尼丁千津子 訳 4. 科学雑誌『Newton(ニュートン)』 2023年10月号、中野太郎 、尾崎太一 執筆、松尾 豊 監修 5. 『天然知能』郡司ペギオ幸夫 著
2023/10/4のピックアップ
今日の気になる用語
- 量子ドット:サイズが極小の半導体ナノ粒子で、光を吸収し再放出する特性を持つ。そのサイズと形状により、放出する光の波長(色)を制御でき、ディスプレイやバイオイメージングに利用されている。
- NASAの火星探査機パーサヴィアランス:火星の表面を探査し、古代生命の証拠を探る探査機。地質や気候のデータを収集し、岩石や土壌のサンプルを地球に送り返す計画もある。
- Amazon Bedrock:APIを通じて基盤モデル(Foundation Models、FM)を利用できる完全マネージド型サービスで、これには大規模言語モデル(LLM)も含まれる。
- M2M100:Facebook AIが開発した多言語間翻訳モデルで、100以上の言語間で直接翻訳が可能。従来の英語を中間言語とするアプローチではなく、任意の言語ペア間で効率的に翻訳を行い、高い翻訳精度を実現している。
- Cloudflare:ウェブサイトの速度とセキュリティを向上させるクラウドプラットフォーム。CDNサービス、DDoS防御、安全なDNSを提供し、ウェブトラフィックを効率的かつ安全に管理する。
- AWS CloudFormation:AWSリソースをコードで定義・管理するサービス。テンプレートを用いてリソースの設定を記述し、自動的にプロビジョニングと構成を行う。
- XAI:AIモデルの判断根拠やプロセスを人間が理解しやすく説明する技術。
- PI (Parmutation Importance):特徴量の重要度を評価する手法。特徴量をシャッフルしてモデルのパフォーマンス変化を測り、各特徴量の寄与を定量的に把握する。
- BATrees (Born Again Trees):既存の決定木モデルを改善する手法で、初期モデルの予測誤差を利用して新しい木を生成し、性能を向上させる。
- PDP (Partial Dependence Plot):特定の特徴量が目的変数に与える影響を視覚化する手法で、特徴量の異なる値に対する平均的な予測値をプロットする。
- ICE (Indivisual Conditional Explanation):PDPを拡張し、個々のデータポイントに対する特徴量の影響を視覚化し、個別のケースにおける特徴量の影響を理解するのに役立つ。
- SHAP (Shapley Additive Explanations):機械学習モデルの予測に対する各特徴量の寄与を定量的に評価する手法。SHAP値はゲーム理論のShapley値に基づいており、特徴量の寄与が公平に割り当てられることを保証し、モデルの予測の解釈を容易にする。
- LIME (Local Interpretable Model-agnostic Explanations):任意の機械学習モデルの予測を解釈可能にする手法で、特定の入力に対するモデルの挙動を近似的に説明する。
- ケモインフォマティクス:化学と情報科学の交差分野で、化合物や薬物の設計・発見を支援する。化学データの解析と活性予測を行い、効果的な新薬候補を探索する。
- AWS Serverless Application Model (AWS SAM):AWS上でサーバーレスアプリケーションを効率的に構築・デプロイするフレームワーク。テンプレート構文とCLIを用いて、リソースの定義とローカルでのテストが容易に行える。
- Rust:システムプログラミングに適した高性能で安全なプログラミング言語。メモリ安全を保ちつつ低レベルの操作が可能で、並行処理やパフォーマンスに優れている。
- Flash Attention:自然言語処理タスクのための高効率なAttention機構。トークン間の依存関係を効果的に捉えることで、計算コストを削減しつつ、高いパフォーマンスを達成する。
- Attention機構:ニューラルネットワークが入力シーケンスの重要な部分に焦点を当てる技術。
- Deep Speed:Microsoftが開発した深層学習モデルの訓練を効率的かつ高速に行うためのライブラリ。
- SLIM(Smart Lander for Investigating Moon):日本の宇宙航空研究開発機構(JAXA)が開発した月面探査機。
- StreamingLLM:長いテキストや対話に対応する大規模言語モデルを効率的にデプロイするフレームワーク。有限の注意ウィンドウで訓練されたモデルを、無限のシーケンス長に一般化し、最大22.2倍の高速化を実現する。
- 逆転の呪い:大規模言語モデル(LLMs)の一般化の失敗を指し、”A is B”の形の文を学習したモデルが”B is A”という逆の関係を自動的に一般化できない現象。
今日の気になる記事
【LLMの技術】
2023/10/4 Flash AttentionとDeep Speedを使ってLLMをGPU1枚でフルファインチューニングする
2023/10/4 大規模言語モデルで「無限の入力」を受け付けることを可能にする手法「StreamingLLM」が開発される
2023/10/4 GPT-4などのLLMが「AはB」から「BはA」を導かない『逆転の呪い』における誤解なき解釈と対策
2023/9/27 The Reversal Curse: LLMs trained on “A is B” fail to learn “B is A”
【AI・データ分析】
2023/10/4 機械学習モデルを説明する技術(XAI)のさわり
2021/12/6 AI を「見える化」する手法: PDP, ICE Plot
2022/10/20 推論結果に強く影響した特徴量を見てみる:LIME (Local Interpretable Model-agnostic Explanations)
2021/5/24 SHAP(SHapley Additive exPlanation)についての備忘録
2023/10/2 ChatGPT で Python プログラミング ケーススタディ:ケモインフォマティクス入門1
2023/10/3 ChatGPT で Python プログラミング ケーススタディ:ケモインフォマティクス入門2
2023/10/4 ChatGPT で Python プログラミング ケーススタディ:ケモインフォマティクス入門3
2023/10/9 ケモインフォマティクス入門書
【IT・AIの未来】
2023/10/4 AI社会はクレーム対応社会? 東浩紀と山田胡瓜が語る、AIが見せるユートピアとディストピア
2023/10/4 なぜ僕らは画像生成AIよりも人のイラストに惹かれるのか 改めて問われる「自分は何がしたかったのか」問題 「AIの遺電子」と探る未来
2023/10/4 データサイエンティストは預言者だった? AI時代の社会の回し方
【Amazon】
2023/10/4 いつの間にかCloudFormationがDeletionPolicyのみの更新に対応していました
2023/10/4 [アップデート]AWS SAM CLIでAWS環境上のLambda関数のテストイベントを操作できるようになりました
【Amazon Bedrock】
2023/10/4 Bedrock APIを使用して画像から画像を作成してみました
2023/10/4 AWSの生成AIサービス「Amazon Bedrock」日本でも活用例続々 竹中工務店やSIerクラスメソッドなど
【Meta】
2023/10/4 Cloudflare社のWorkers AIでも使用されているM2M100という多言語翻訳モデルを使ってみた
2023/6/13 M2M100 で英日翻訳するメモ(MIT ライセンスで商用利用可能! LLM への翻訳レイヤーとして期待)
【OpenAI】
2023/10/4 はじめてのChatGPT API 〜API呼び出し編〜
【Microsoft】
2023/10/4 MicrosoftがOneDriveの刷新を発表、AIサービス・Copilotも使えるように
2023/10/4 無料でアニメ風イラストも実写風画像も簡単に生成できるMicrosoft公式機能がBingチャットに追加されたので使ってみた、OpenAIのDALL-E 3で超高精細な画像生成が可能
2023/10/4 WindowsにおけるRust採用はカーネルだけじゃない……Microsoftがちょっと言及
【その他の会社】
2023/10/4 サイバーエージェント、ゲームとアニメのAI研究機関を新設 各制作フローで生成AIの活用法探求
【科学・技術】
2023/10/4 ノーベル化学賞「量子ドット」発見のアメリカの研究者ら3人に
2023/10/4 火星で発生した高さ2kmに達する「ダスト・デビル(塵旋風)」をNASAの火星探査機パーサヴィアランスが撮影
2023/10/4 月着陸実証機「SLIM」、地球周回軌道を離れていよいよ月へ
【その他】
2023/10/4 バグがあっても心配いらない、それは単なるコードです
2023/10/3のピックアップ
今日の気になる用語
- pytool-directory:LangChainを簡単に体験できるライブラリで、DialogPlayディレクトリに登録されたAPI情報を利用して外部APIを簡単に呼び出せる。
- mixpanel:Webおよびモバイルアプリケーションのユーザーインタラクションを追跡するイベント分析サービスで、収集されたデータを用いてカスタムレポートを作成する。
- CoVe (Chain-of-Verification):言語モデルが生成する誤情報を減少させ、ドラフト回答を検証する質問を計画し、独立して回答して最終的な検証済み回答を生成する方法。
- dbt (data build tool):データウェアハウス内のデータを効果的に変換するためのオープンソースツールで、SQLでデータモデリングを行い、バージョン管理、ドキュメンテーション自動化、テストの統合などをサポートしている。
- RAG (Retrieval-augmented Generation):情報検索とテキスト生成を組み合わせ、事実を検証しながらより正確なテキスト回答を生成する技術。
- STUDIO:直感的なUIと高い表現力を持つノーコードWeb制作プラットフォームで、ユーザーはコーディングなしで自由にWebデザインを行うことができる。
- DreamGaussian:1枚の画像から高速で高画質の3Dコンテンツを生成するAIツールで、特に3D Gaussian Splatting技術を利用して効率的な3Dコンテンツ作成を支援する。
- Bun:JavaScriptとTypeScriptのための高速なオールインワンツールキットで、Node.jsの代替として設計されている。
- Stable LM3B:Stability AIが開発した30億パラメータを持つコンパクトで効率的な言語モデルで、携帯デバイスやラップトップで動作する。
今日の気になる記事
【あたらしいLLM】
- 2023/10/3 Stability AI、ノートPCでも動作する大規模言語モデル(LLM)を発表 「Stable LM 3B」
【LLMの技術】
- 2023/10/3 LLMのハルシネーション(勝手に事実と違う情報を出力)問題を減らす手法「CoVe」について試しました
- 2023/10/3 ゲームシナリオからLLM学習用データセットを作成・公開するプロジェクト始動
【LangChain】
- 2023/10/3 簡単にLangChainを使う
【RAG】
- 2023/10/3 RAGアプリケーションにおけるLLM評価のベストプラクティス
【データ基盤】
- 2023/10/3 dbt Coreとdbt Cloudの関係性・違いなどについてまとめてみた #dbt
- 2021/12/14 データエンジニア界隈で話題のdbt(data build tool)のまとめ
- 2020/9/4 データ変換処理をモダンな手法で開発できる「dbt」を使ってみた
【AI・データ分析】
- 2023/7/21 mixpanelとは?できることや使い方・特徴をわかりやすく解説!
【Google】
- 2023/10/2 Google Bardの圧倒的進化!ChatGPTユーザー必見の有能機能3選
【Amazon Bedrock】
- 2023/10/3 [初心者向け] Amazon Bedrockを使ってPythonでClaudeと遊ぶための最初の三歩くらい
- 2023/10/3 Amazon Bedrockで使用できるClaudeモデルのトークン数をAnthropic SDKでカウントしてみた
- 2023/10/3 AWS東京リージョンで Amazon Bedrockが利用可能になりました
- 2023/10/3 Amazon BedrockでテキストのEmbeddingsを取得してみた
- 2023/10/3 litellmを利用してAzure OpenAIとAmazon BedrockのチャットAPIを共通的に呼び出す
- 2023/10/3 Amazon Bedrock を利用してスマートホームスキルを起動するパーソナルアシスタントAIっぽいコードを書いた
- 2023/10/2 Amazon BedrockをLangChain経由で使って会話履歴も保存してみた
【ソフトウェア・アプリケーション開発】
- 2023/10/3 Reactベースのフレームワーク「Next.js 13.5」正式リリース。使用メモリ40%削減、ローカルサーバ起動の高速化など性能向上
- 2023/10/3 FigmaからコピペでWebサイトが完成! HTMLもCSSも書かないノーコードツール「STUDIO」がスゴすぎる
- 2023/10/2 Bunかる〜く触ってみた[Bunの実行, nodeとの比較]
- 2023/9/11 JavaScriptランタイム「Bun 1.0」正式リリース。Windows版もまもなく登場へ
【科学・技術】
- 2023/10/3 ノーベル物理学賞「アト秒」で光出す手法開発 米欧の研究者3人
- 2023/10/3 「すごい流れ星が見えるかも」 400粒もの“流れ星の素”を積んだ人工衛星が近く大気圏再突入
- 2023/10/3 パーキンソン病の原因は「ミトコンドリアDNAの損傷」かもしれないという研究結果
- 2023/10/3 囲いなしでその場所だけ“防音化” 特定の人物の声だけを“消す・聞く”ができる小型音響ロボット群
- 2023/10/3 視覚情報によるロボットのていねいな物体操作を実現=産総研
- 2023/10/3 トコジラミを駆除する方法&自宅に持ち込まない予防法まとめ
- 2023/10/3 「1枚絵の3D化」が非常に手軽な操作で実行できる軽快なツール『DreamGaussian』とWebでの使い方
【教育・マネジメント】
- 2023/10/3 プログラミング初心者がゲーム感覚で楽しく学べる無料サービス16選
- 2023/10/3 アジャイル開発の「人的側面」の課題を解決する「システムコーチング」
- 2023/10/3 リモートワークは生産性を損なうのか?
- 2023/10/3 「未来」って自由に発想するものじゃなかった? なぜ企業から“戦略的な未来”が出てきてしまうのか
- 2023/10/3 財務諸表というフレームワークで考えるソフトウェア開発と技術的負債
【その他】
- 2023/10/3 NotionにZipファイルを元に復元する汎用インポートが実装されたのでエクスポートファイルで試してみた
- 2023/10/3 サグラダ・ファミリア聖堂、建設完了近づく 福音書作家の4塔が完成
2023/10/2のピックアップ
今日の気になる用語
- Claude2:Anthropicの最新のLLM。Amazon Bedrockで使える。
- Anthropic:元OpenAIエンジニアが立ち上げた非公開企業。GoogleやZoom、SK Telecomなどが出資。
- CoT (Chain-of-Thought):題解決の一連の手順や中間的な推論ステップを通じて複雑な推論能力をAIに可能にするテクニック。
- ToT (Tree of Thoughts):CoTと古典的なツリー探索を組み合わせることにより、LLMの回答の質を上げる技術。
- AoT (Algorithm of Thoughts):CoTの派生系。大規模言語モデル(LLM)の推論能力を強化する技術で、アルゴリズム的推論パスを通じてLLMを推進し、複雑なタスクやクエリを効率的に処理しながら人間に似た推論を可能にする。
- MP (Metacognitive Prompoting):大規模言語モデル(LLM)が自己評価を行い、初期の判断を再評価して反省する(メタ認知を行う)ことで、より深い理解と推論能力の向上を促進する枠組み。
- LogiCoT(Logical Chain-of-Thought):既存のChain-of-Thought(CoT)フレームワークを発展させ、大規模言語モデル(LLM)が自らの論理的整合性をチェックし、推論能力を向上させるためのフレームワーク。
- ReConcile:複数の大規模言語モデル(LLM)エージェント間で「円卓会議」のような協議を行い、多様な意見と合意を形成することで、LLMの推論能力を向上させるフレームワーク。
- RE2 (Re-reading):大規模言語モデル(LLM)に質問文を2回読ませる手法で、これによりLLMの推論能力が向上することが報告されている。
- Pegasus:Appleの独自検索エンジン。
- J-Quants:個人向けに金融データをAPIで配信するサブスクサービス。
- Databricks:データウェアハウス・データレイクとAIを扱う米国企業。
- Snowflake:データウェアハウス・データレイクを扱うデータクラウド提供企業・サービス。
- AWS Skill Builder:AWSが公式で公開しているオンライン学習サービス。
- ProPainter:シンガポールの南洋理工大学が開発した、動画内の指定した不要な動く物体を後から編集で消す技術。
- Neuralink(ニューラリンク):イーロン・マスクが設立した、脳インタフェース(BCI)企業(脳に電極を埋め込む)。被験者を募集中。
- BCI (Brain-Computer Interface):脳の神経細胞が発する電気信号をコンピュータに伝え、考えるだけでデバイスを操作する技術。
- GraalOS:Oracleが開発した、Javaをサーバレス環境で実行するのに最適化した技術。
- Oracle Cloud Functions:Oracle Cloudのサーバレス実行基盤。
- Amazon Bedrock:APIを通じて基盤モデル(Foundation Models、FM)を利用できる完全マネージド型サービスで、これには大規模言語モデル(LLM)も含まれる。
- RealFill:Googleとコーネル大学が開発したAIで、複数の失敗写真を元にベストショットを後から作り出せる。
今日の気になる記事
【あたらしいLLM】
【LLMの技術】
2023/10/2 大規模モデルを単一GPUで効率的に学習する方法
2023/10/2 LLMをより賢く使うための論文8選[2023年9月最新版]
2023/10/2 GPT-4、Bard、Claude2などの異なるLLMが円卓を囲み議論した結果の回答は品質が高いとの検証報告。円卓ツールも公開
【データ基盤】
2023/10/2 2023年9月にリリースされたSnowflakeの新機能・変更点の個人的な注目情報まとめ #SnowflakeDB
【AI・データ分析】
2023/10/2 第356話|深層課題の探求:データ分析で見逃される真実を捉える
【Google】
2023/10/1 Google Cloud (GCP) を使った kaggle の環境構築メモ
【Amazon Bedrock】
2023/10/2 AWSで使えるようになったAnthropicのClaude v2とGPT4を比較してみた
2023/10/2 [プレビュー] Amazon Bedrock のモデル呼び出しのログ記録設定を試してみた
【Meta】
2023/10/2 「数十億人が使うAI」を目指すMeta Googleの“次”を固めるBing
【Apple】
2023/10/2 Appleは独自の検索エンジン「ペガサス(Pegasus)」を開発中で間もなくApp Storeに導入予定、アプリの検索機能だけでなくGoogle検索に取って代わる可能性も
【OpenAI】
2023/10/2 5分で学ぶOpenAI APIハンズオン
【ソフトウェア・アプリケーション開発】
2023/10/2 サーバレスに最適化したJava実行基盤「GraalOS」、オラクルが発表。Javaをネイティブバイナリにコンパイルし瞬時に起動
【科学・技術】
2023/10/2 ノーベル生理学・医学賞にカリコ氏ら コロナワクチン開発 貢献
2023/10/2 NTTと東大、悪天候でもドローンを精密誘導する「ミリ波RFIDタグ」
2023/10/2 「いらない人やモノ」だけを映像からキレイに消す技術「ProPainter」 シンガポールの研究者らが開発【研究紹介】
2023/10/1 失敗写真複数枚からベストショットを生成できるAI「RealFill」、Stable DiffusionのOutpaintingより圧倒的に正確
2023/10/2 イーロン・マスクのBCIで「脳の高速通信」は実現できる?
【教育・マネジメント】
2023/10/2 AWS Skill Builder にてオンライン学習。
【その他】
2023/10/2 筋肉ですべてを解決する人のプログラミング上達方法
2023/10/1のピックアップ
今日の気になる用語
- LMDX(Language Model-based Document Information Extraction and Localization):大規模言語モデルを活用して非構造化文書(例:レシート)から高精度にテキストを抽出する技術。
- LogiCoT(Logical Chain-of-Thought):既存のChain-of-Thought(CoT)フレームワークを発展させ、大規模言語モデル(LLM)が自らの論理的整合性をチェックし、推論能力を向上させるためのフレームワーク。
- Amazon Bedrock:APIを通じて基盤モデル(Foundation Models、FM)を利用できる完全マネージド型サービスで、これには大規模言語モデル(LLM)も含まれる。
- LangChain:大規模言語モデル(LLM)を利用してアプリケーション開発を効率的に行うためのライブラリ。
- LaMDA:GoogleのチャットAI「Bard」に搭載されているLLM。2021年5月に発表。
- Imagen:テキストから画像を生成するAIシステムで、非常に高いフォトリアリズムと深い言語理解を持つ。
- RT-1 (Robotics Transformer 1):画像と自然言語の命令を入力として受け取り、リアルタイムでロボットの動作を制御するアクション生成モデル。
- PaLM:GoogleのLLM。LaMDAは会話に特化したモデルだが、PaLMはより幅広い用途での利用が想定されている。
今日の気になる記事
【LLMの技術】
2023/9/29 GPT-4などのLLMに「自らの論理的な整合性をチェック」させるフレームワーク『LogiCoT』と実行プロンプト
【Google】
2023/9/28 GoogleがLLMで「非構造化文書」高精度テキスト抽出するOCR『LMDX』発表。Bardを強化する可能性
2023/10/1 Google のAI製品リリース年表
【Amazon Bedrock】
2023/10/1 Amazon Bedrockで入門するLangChain
コメント