未定の部屋

主にデータサイエンス関係の記事を書きます

LlamaIndex × Azure OpenAIでRAGを試す

AI

タイトル通りですが、LlamaIndexのバージョン更新が早くて2024年1月時点の最新バージョンでの日本語記事がなかなか見つからなかったので、公式ドキュメントを参考に実装した内容をこちらに載せようと思います。 簡単な用語説明 実行環境 実装 参考 簡単な用…

AWS×Streamlit×GPTでペルソナ作成・リサーチアプリを作ってみた

こんにちは。ChatGPTがリリースされてからLLM以外の技術トピックをめっきりキャッチアップしなくなってしまい、まずいなと思いつつモチベが上がらない日々を過ごしています。今回はそんなLLMを使ったWEBアプリを作ってみたので、その内容を紹介しようと思い…

GPT3.5にブログを書かせる

AI

こんにちは。最近仕事をサボってChatGPTとかで遊びがちなのですが、AWSとかも使って色々やってた結果ブログを自動作成してくれるツールができました。せっかくなのでブログを書いてもらおうと思います。 ツールについて 使ってみた 適当にテーマを入れてみる…

Lambdaで形態素解析をする

最近業務でAWSを触ることが多く、その中で形態素解析をする機会があったので、その際の内容を備忘録として残しておきます。 やったこと 手順 手順詳細 参考 やったこと AWSのサービスを使い、ファイルがS3に置かれたら自動で形態素解析ができるようなシステ…

DockerコンテナをデプロイしてLambda関数を使う

こんにちは。最近業務でAWSを触ることが多く、その中でLambdaを使うことがあったのですが、3rd partyライブラリを使うのが思ったより大変だったので記事にしようと思います。zipファイルをLambdaにアップロードする・Lambda Layerを利用するといった方法もあ…

VSCodeを使ってEC2インスタンスにSSH接続する

こんにちは。最近業務でAWSを触ることが多く、その中でEC2インスタンスにSSH接続するところで躓いたので備忘録として残しておこうと思います。 前提 VPC、セキュリティグループ、IAMロールの準備(必要に応じて) VPC セキュリティグループ IAMロール EC2イン…

Chat GPT 備忘録(2023年3月24日時点)

AI

所感 プロンプトエンジニアリングとは 色々なメソッド 深津式汎用プロンプト(2023/2) ナレーション誘導型生成法(2023/3) ゴールシークプロンプト(2023/2) 再起処理でのプロンプト(2023/3) フィードバックプロンプト(2023/3) 細かなTips 深津貴之氏 詠み人知…

因果推論とビジネス適用について考えてみる

こんにちは。 最近『統計的因果推論の理論と実装』という書籍を一通り読み終わったので、書籍の感想+ビジネス適用というテーマで思うところを書いてみます。 新卒二年目の視点なので、現場の感覚・観点になると思います。 書籍の感想 因果推論のビジネス適用…

BERT論文解読

こんにちは。 以前BERTを実務で使った際に論文を読んだのですが、その時のメモを公開しようと思います。 ググれば日本語の論文解説はいくらでも出てくるのでアレですが、備忘録的に残そうと思いブログに載せました。自然言語処理系の論文をちゃんと読むのが…

ipynbファイルをいい感じにgit管理できるツールnbdimeを使ってみた

※2021年11月に書いた記事を再投稿したものになります こんにちは。業務では主にデータ分析をしていて、普段はJupyter NotebookでPythonを書くことが多い人です。 きっかけ nbdimeのインストール 簡単な運用例 コマンド上で差分を表示する web上で差分を表示…

Anaconda・非Anacondaのそれぞれの環境でPystanを運用できるようにしてみた

※2021年7月に書いた記事を再投稿したものになります こんにちは。最近データ分析のスキルのうちデータエンジニアリングの重要性をひしひしと感じている新入社員です。 ここでいうデータエンジニアリングは、データサイエンスを意味のある形に使えるようにし…

『機械学習を解釈する技術』を読みました

※2022年6月に書いた記事を再投稿したものになります こんにちは、今回は『機械学習を解釈する技術』という本を読んだので、簡単な感想+αを残しておきたいと思います。 『機械学習を解釈する技術』の感想 結果の解釈と因果関係 おわりに 『機械学習を解釈す…

ベイズモデリング学習記録

※2021年11月に書いた記事を再投稿したものになります こんにちは。夏ごろからふわっとベイズモデリング関連の勉強をしてきたので、個人的な感想を交えつつ軽く振り返りたいと思います。 ベイズ統計の基礎は知っていたものの、ベイズモデリングについてはなん…

Kaggle本

※2021年6月に書いた記事を再投稿したものになります 今回は、『Kaggleで勝つデータ分析の技術』という本を読んだので、概要と感想を書いていこうと思います。 Kaggleで勝つデータ分析の技術作者:門脇 大輔,阪田 隆司,保坂 桂佑,平松 雄司技術評論社Amazon 購…

Pythonで因果分析

※2021年5月に書いた記事を再投稿したものです 内容 概要 因果推論 因果探索 感想と今後 内容 今回は『つくりながら学ぶ! Pythonによる因果分析 ~因果推論・因果探索の実践入門 (Compass Data Science)』(小川雄太郎)という本を読みました。 つくりながら学ぶ…

新卒1年目の学習記録

こんにちは。 昨年4月に新卒でマーケティング系の会社に入社し、データサイエンティストとして働いています。 入社してから最初の1年間での、学習記録を書き起こしてみます。 元々データサイエンス専攻ではなかったり入社したばかりだったりということもあっ…

活性化関数ReLUのすごさについて

活性化関数ReLUのすごさを伝えたいと思い資料を作成しました。 なるべくディープラーニングを知らない人にも伝えたいと思って作りました。