opsの人気記事 92件 - はてなブックマーク

1 - 40 件 / 92件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

opsの検索結果1 - 40 件 / 92件

opsに関するエントリは92件あります。運用、 aws、開発などが関連タグです。人気エントリには『AWS システム構築非機能要件ヒアリングシートを公開してみた | DevelopersIO』などがあります。

AWS システム構築非機能要件ヒアリングシートを公開してみた | DevelopersIO
- 1175 users
- dev.classmethod.jp
- テクノロジー
- 2020/07/27
こんにちは。ご機嫌いかがでしょうか。 "No human labor is no human error" が大好きなネクストモード株式会社の吉井亮です。日本国内においても多くのシステムがクラウド上で稼働していることと思います。俊敏性、拡張性、従量課金、IaS、セキュリティなどクラウドのメリットを享受しやすい所謂 SoE で多くの実績があるように感じます。ここ1~2年は、社内基幹システム・情報システム、SoR 系のシステムのクラウド移行が本格化してきたというのが肌感覚であります。クラウドでのシステムインフラ構築は従来のようにゼロから非機能要件定義を行っていくものではなく、ベストプラクティスをまず実装して少しずつ微調整を行っていくものと考えています。とはいえ、システムごとの要件は予め明らかにしておくことがインフラ構築においても重要になります。クラウド上では出来ること出来ないこと
みずほ銀行システム障害に学ぶ
- 997 users
- ja.kohsuke.org
- テクノロジー
- 2021/06/17
みずほ銀行システム障害の調査報告書が公開されたのがニュースになって、Twitterなどで色々な人がコメントをしているのを見た。140文字しか書けない空間で他人の失敗談の揚げ足取りをするのは簡単だが、そこからは一時の爽快感以外に何も得るものがないので、僕はそういうのはカッコ悪いと思っている。そこで、ちゃんと読んでみたら全く他人事でない部分も沢山あるし、非常に面白く勉強になったので、ブログにまとめてみる。技術的な話銀行のシステムがどのようになっているのか、全然イメージが湧いていなかったので、それがまず勉強になった(p.29)。トラフィックのソースに応じて用意された色々なシステムから基幹システム「MINORI」の取引メインバスにトラフィックが流れ、そこから各種システムへとリクエストが送られていく。この辺はService Oriented Architectureらしい。開発当時としては（
- 障害
- あとで読む
- システム
- 開発
- IT
- development
- 運用
- 銀行
- セキュリティ
- 仕事
障害報告書を書こう！ - Qiita
- 842 users
- qiita.com/Ping
- テクノロジー
- 2022/07/04
担当しているITサービスなどに何かしらのインシデントや障害が発生した時に、対処後のアクションとして報告書を提出して事象の内容を報告（レポート）する場合がある。提出先は会社の偉い人だったりクライアントだったり。場合によってはユーザー向けに発表したり。事の顛末を報告して「今後同様のことを起こさないように努力します、ごめんなさい」をするのだ。どのように再発防止の努力するのかを書くものでもある。主にクライアント向けのビジネス内容ではあるが、自分が使っているテンプレパターンを共有するので参考にしてもらえればと思う。1 全般的なポイント心得のようなもの。次の点は留意してて欲しい。淡々と冷静な説明をこころがける当然のことながら事実は脚色しない。無駄な修飾も要らない。客観的な事実を簡潔に述べる。例： ❌「一生懸命頑張って対応したが…」 ❌「寝ないで対応したが…」 ❌「本当の原因は…」できるだ
- ドキュメント
- あとで読む
- 障害
- 運用
- 仕事
- qiita
- 技術
- 資料
- IT
- マネジメント
【2024年6月版】管理画面のUIデザインにおける25の改善ポイント | ベイジのUIラボ～業務システムとSaaSのUIを考える
- 807 users
- baigie.me
- テクノロジー
- 2020/06/16
私たちの日常業務で使われる管理画面は、大量の情報と複雑な機能で構成され、利用難度が高い傾向にあります。検索性の乏しい管理画面の一覧から1つの情報を見つけるために、どれだけの時間を費やしているでしょうか。 1億円の工数をかけて開発した機能も、低品質なデザインでは、機能の存在に気付かれなかったり、間違って使われたりと、期待した業務コストの削減に繋がりません。これでは、1億円を捨てたようなものです。使い勝手の良くないデザインは、ユーザーだけではなく、開発者にも悪影響を及ぼします。複雑な構造と分かりにくい操作体系の管理画面は、開発やテストの手間を増やし、その後の機能拡張も難しく、改修コストも増大します。これらのリスクを抑えるためには、UIデザインの基本原則を理解し、適切に管理画面を設計することが重要です。私たちは管理画面のUIデザインの改善やリニューアルを手掛けることも多いのですが、その経験
- ui
- デザイン
- あとで読む
- 管理画面
- design
- システム
- Admin
- 管理
- web
- webデザイン

数時間かかる週一リリースを毎日何度も爆速でできるようにするまで / CI/CD Conference 2021
- 514 users
- speakerdeck.com/k0kubun
- テクノロジー
- 2021/09/03
CI/CD Conference 2021
- ci
- あとで読む
- devops
- デプロイ
- 開発
- terraform
- CD
- development
- サーバ
- cicd
もし今1からKubernetesを勉強するとしたらどうやって勉強するか - 腹は減る
- 509 users
- blux.hatenablog.com
- テクノロジー
- 2020/07/31
Kubernetesを触り始めて約1年。 1年の間にたくさんKubernetes関連の日本語書籍が出たし、1年の間に「え、これ先知っておきたかったわ」ということがありました。ということで今1から勉強するとしたらどうするかな〜と考えたのでまとめてみます。あくまで私ならどうするか、ていう話なので人によっては再現が難しい可能性があるのであしからず！！（英語がある程度できる前提で書いてるところもあります）条件ドキュメントをいきなり読むのは日本語だろうと結構苦手なるべく手を動かしたい最初はアプリケーションエンジニアとしてKubernetesを触れるくらいのレベル感をめざす Dockerはなんとなくわかる分散システムにあまりなじみがない本当はできれば最初からドキュメントをしっかり読み通すのが一番いいと思っている！思っているよ... 1st step 動画を見る UdemyのCKAのコー
- kubernetes
- あとで読む
- k8s
- 勉強
- docker
- 本
- infra
- code
- programming
Postgres と MySQL における id, created_at, updated_at に関するベストプラクティス
- 501 users
- zenn.dev/mpyw
- テクノロジー
- 2022/06/16
読者対象ある程度データベースに関する知識を持っている，経験年数 1 年以上のバックエンドエンジニア特定のプログラミング言語に依存する部分は含めないため，すべての SQL 使用者を対象とするまた，ゼロからの丁寧な説明というよりは，リファレンス感覚で使える記事という形にまとめる。 RDBMS の対象バージョン PostgreSQL: 9.4 以降 MySQL: 8.0.28 以降 id （データ型と INSERT 時のデフォルト埋め）導入一般的に採用されやすいプライマリキー用の値として，以下を考える。連番整数 MySQL では AUTO_INCREMENT， Postgres では IDENTITY や SERIAL と呼ばれるもの UUID v1: ハードウェアごとにユニークな単調増加値 UUID v4: ランダム値 UUID v7（ドラフト）: 単調増加であるタイムスタンプとラ
- postgresql
- mysql
- db
- あとで読む
- SQL
- database
- データベース
- UUID
- 設計
- id
あんどぅ on Twitter: "本番運用するといずれ誰もがたどり着く、公式ドキュメントには書かれてないログ管理の現実解が資料化されていてすばらしいそう、CloudWatch LogsにはDev環境 or ERRORの場合のみ飛ばすFluentdの設定をすることで利便性と料金のバランスをとるのであるこれは公式ドキュメントにすべき https://t.co/RE4FmPCpJX"
- 492 users
- twitter.com/integrated1453
- テクノロジー
- 2022/11/10
- aws
- あとで読む
- ログ
- 運用
- fluentd
- ドキュメント
- 環境
- インフラ
- サーバ
- monitoring
MySQL のレプリケーションから10年間逃げてきた我々が学んだこと8選 - Cybozu Inside Out | サイボウズエンジニアのブログ
- 472 users
- blog.cybozu.io
- テクノロジー
- 2020/10/26
こんにちは。クラウド運用チームで SRE をしている飯塚です。今回は、MySQL のレプリケーション機能を約10年もの間ずっと使ってこなかった私たちが、レプリケーションを使った高可用性構成に移行するための取り組みの中で学んだことについて紹介します。背景巨大なテーブルへの primary key の付与トランザクションサイズが大きい場合には tmpdir に注意 mysqldump で絵文字が消えていないか要チェック mysqldump が Error 1412: Table definition has changed... で失敗する mysqldump したデータのリストアが Duplicate entry 'xxx-yyy-PRIMARY-n_diff_pfx01' for key 'PRIMARY' で失敗することがある mysqldump したデータのリストア時のディスク
- mysql
- あとで読む
- DB
- レプリケーション
- cybozu
- innodb
- データベース
- database
- 設定
- replication
アプリケーション開発者は Amazon ECS あるいは Kubernetes をどこまで知るべきか #AWSDevDay / You build it, you run it
- 413 users
- speakerdeck.com/toricls
- テクノロジー
- 2021/09/29
Talked at AWS Dev Day Online Japan 2021. - 動画: https://youtu.be/I7mMQshlpcs - イベントページ: https://aws.amazon.com/jp/about-aws/events/2021/devday - Pro…
- kubernetes
- aws
- ecs
- あとで読む
- コンテナ
- k8s
- 開発
- devops
- 運用
- docker
コンテナ運用におけるログ基盤設計のベストプラクティス - Qiita
- 406 users
- qiita.com/naomichi-y
- テクノロジー
- 2020/12/24
課題数年前と比較すると、GKEやECSを始めとするコンテナ実行環境でのアプリケーション運用を行うサービスはかなり増えてきた印象があります。コンテナを運用する上では、アプリケーションのイベントを追跡する上でログをどう扱うかが課題になります。今までのように古いログを定期的にローテートして別のストレージに転送するといった手法はクラウドネイティブなアーキテクチャには最適とは言えません。アプリケーション開発の方法論として、Twelve Factor App ではログをイベントストリームとして扱うためのガイドラインが示されていますが、近年のWebアプリケーションではシステムを疎結合に連携するマイクロサービスという考え方が主流になりつつあります。アプリケーションログはサービスごとにフォーマットを整形した上で、ログ収集サービスに配送。必要に応じてリアルタイム分析や異常データの通知、そしてデータの可
- コンテナ
- あとで読む
- ログ
- 運用
- 設計
- docker
- ecs
- qiita
- kubernetes
- aws
「運用組織」の考え方と設計〜運用組織論 2021 / 20210310-ssmjp-operation-organization
- 372 users
- speakerdeck.com/opelab
- テクノロジー
- 2021/03/11
ssmjp ssmonline #8 "第三回はたのさん祭オンライン"( https://ssmjp.connpass.com/event/206074/ )での発表資料です。 (運用設計ラボ合同会社波田野裕一)
- 運用
- 設計
- 組織
- あとで読む
- 考え方
- devops
- management
- ssmjp
- マネジメント
- 仕事
「コード書きました、あとはよろしく」では優れたソフトウェアは生まれない　コンテナのスペシャリストが語る、運用性を損なう8つの実装例
- 367 users
- logmi.jp
- テクノロジー
- 2022/02/03
今押さえておくべき知識をアップデートし、ノウハウを共有し、さらなるスキルアップを実現する場として開催されている、AWS で最も Developer に特化したカンファレンス「AWS Dev Day Online Japan」。ここでSr. Product Developer Advocate, Elastic Containersの原氏が登壇。続いて、運用性に優れたソフトウェアが重要な理由と、運用性を損なう8つの実装例について紹介します。前回はこちらから。 You build it, you run it 原トリ氏：（スライドの「You build it, you run it」を指して）この言葉、聞いたこと、見たことがある方がいるかもしれません。これは、2006年にACM（Association for Computing Machinery）という団体が、Amazon AWSのCTOで
- 開発
- あとで読む
- 運用
- コンテナ
- aws
- ソフトウェア
- docker
- devops
- コード
- 仕事
Cloudflare outage on June 21, 2022
- 365 users
- blog.cloudflare.com
- テクノロジー
- 2022/06/21
Today, June 21, 2022, Cloudflare suffered an outage that affected traffic in 19 of our data centers. Unfortunately, these 19 locations handle a significant proportion of our global traffic. This outage was caused by a change that was part of a long-running project to increase resilience in our busiest locations. A change to the network configuration in those locations caused an outage which starte
- cloudflare
- CDN
- あとで読む
- 障害
- network
- incident
- ネットワーク
- BGP
- トラブル
- セキュリティ
入門入門監視 / reading-practical-monitoring
- 300 users
- speakerdeck.com/o0h
- テクノロジー
- 2021/02/21
「入門監視」を読んだので、自分たちのチームに当てはめて考えてみる
- 監視
- あとで読む
- 運用
- monitoring
- slide
- book
- 入門
- dev
- development
サーバ作業を安全に行うための工夫
- 271 users
- heartbeats.jp
- テクノロジー
- 2022/09/27
こんにちは。 2021年7月にハートビーツに入社後、エンジニアリンググループに所属している北岡です。以前は同じMSP企業で10年以上勤務しておりましたが、自身のスキル向上などを目的としてハートビーツへ入社しました。私の転職の経緯やハートビーツへ入社して感じたことなどは今後お話するとして、今回はお客様のLinuxサーバ上で作業する際、私がオペレーション中に意識していることやミスを防ぐために行っていることについて紹介します。コピー、ペーストのショートカットキーを変更するコピー「Ctrl + c」とペースト「Ctrl + v」はキーが隣り合っており、タイピングミスによってコピーしようとしたつもりがペーストしてしまったということが起こりえます。メモ帳などで起きた場合は特に問題にはなりませんが、サーバ上で起きると不要なコマンド実行に繋がります。小さなことではありますが防止策をとるべきです。
- サーバ
- あとで読む
- コマンド
- 運用
- linux
- tmux
ローカルマシンでDocker を動かさないためにBlimp を採用する - y-ohgi's blog
- 263 users
- y-ohgi.blog
- テクノロジー
- 2020/12/15
https://blimpup.io TL;DR docker-compose をリモートで実行するための開発フェーズ向けのサービスローカルマシンへ負荷をかけずに開発できる URL を発行してくれるため第三者への公開も可能概要 blimpup はざっくりいうと「docker-compose をリモートで実行する」ためのサービスです。用途としては本番環境としてではなく開発フェーズでの利用を想定されており、docker-compose を使用した開発の効率化を行ってくれます（k8s のtelepresence に近いイメージです）。従来開発フェーズで使用していたdocker-compose をローカルで直接コンテナを動かすのではなく、blimp の提供するインフラ上で動かし、ローカルマシンに負荷をかけることなく開発が可能になります。ローカルのファイルと同期を行ってくれるためファイルの更
- docker
- 開発
- あとで読む
- コンテナ
- サービス
- docker-compose
- コマンド
- development
- dev
- 仮想化
レガシーとの向き合い方　〜cron から Rundeck へ〜 - DMM inside
- 262 users
- inside.dmm.com
- テクノロジー
- 2020/08/11
｜DMM inside
- cron
- 運用
- rundeck
- あとで読む
- slack
- サーバ
- システム
- server
- バッチ
- Linux
運用設計における設計項目の体系化 / 20240207-ssmjp-operation-design-items
- 257 users
- speakerdeck.com/opelab
- テクノロジー
- 2024/02/08
ssmjp ssmonline #38 "第四回はたのさん祭オンライン"( https://ssmjp.connpass.com/event/307397/ )での発表資料です。 (運用設計ラボ合同会社波田野裕一)
- 運用
- あとで読む
- 設計
- 開発
- 資料
- システム
AWSのCLI作業はどこで行う？安全に管理するパターンとメリデメ集 | DevelopersIO
- 233 users
- dev.classmethod.jp
- テクノロジー
- 2021/05/28
AWSアクセスキーセキュリティ意識向上委員会って何？昨今、AWSのアクセスキーを漏洩させてしまうことが原因でアカウントへの侵入を受け、多額の利用費発生・情報漏洩疑いなど重大なセキュリティ事案が発生するケースが実際に多々起きています。そこで、アクセスキー運用に関する安全向上の取組みをブログでご紹介する企画をはじめました。アクセスキーを利用する場合は利用する上でのリスクを正しく理解し、セキュリティ対策を事前に適用した上で適切にご利用ください。 AWS CLI、どこから使っていますか？ざっくり、以下4種類のどれかを使っている方が多数派ではないでしょうか。ローカル端末 AWS内に構築した管理用EC2にSSHを利用して接続 AWS内に構築した管理用EC2にSSM(セッションマネージャ)を利用して接続 AWS CloudShell 一体どう違うのでしょうか。状況によって良し悪しは異なる
- aws
- あとで読む
- CLI
- iam
- セキュリティ
- 運用
- security
- 管理
- Amazon
個人でもAWS Organizationsを使ったほうが良い理由 - 本日も乙
- 227 users
- blog.jicoman.info
- テクノロジー
- 2021/07/23
技術書典11で「Amazon Web Servicesコスト最適化入門マルチアカウント編」を頒布中です。 techbookfest.org BOOTHでも購入できますが、送料（370円）がかかってしまうので、7/25までであれば技術書典のオンラインマーケットだと送料がかからずお得かと思います。オンラインマーケットだと物理本の発送が8月になってしまいますが、BOOTHは私が発送するので注文後数日で届きます。すぐに物理本が欲しい人はBOOTHまで。 booth.pm マルチアカウントに対する障壁の高さ個人用途におけるマルチアカウントのメリット使い捨てのAWSアカウントを作ることができる検証用環境として活用する GCPのプロジェクトと同じような感覚マルチアカウントのデメリットアカウントの削除（解約）が面倒セキュリティコスト管理まとめマルチアカウントに対する障壁の高さ 6/19
Pythonでコードを書いてAWSやKubernetesのシステム構成図を出力できる「Diagrams」
- 226 users
- gigazine.net
- テクノロジー
- 2020/05/18
システムの構成を社内で共有したり外部に説明したりする際に、システム構成図を作成した経験のあるエンジニアは多いはず。ダイアグラム作成ソフト「Diagrams」を使うと、AnsibleやSubiquityといった「Infrastructure as Code(IaC)」に関連するサービスのように、プログラミング言語のPythonでコードを書くことで、クラウドやオンプレミスの構成図を描くことができます。 Diagrams · Diagram as Code https://diagrams.mingrammer.com/ まずはDiagramsの動作に必要なパッケージをインストールします。今回Diagramsのインストールに利用するのはUbuntu 18.04です。 sudo apt install -y python3 python3-pip graphviz 続いてDiagramsをインスト
- python
- diagrams
- あとで読む
- 作図
- aws
- kubernetes
- コンテナ技術
- gigazine
- アーキテクチャ
- Docker
最強のツール「LangSmith」が登場した話【Python / LangChain】
- 218 users
- zenn.dev/umi_mori
- テクノロジー
- 2023/07/23
【📩 仕事の相談はこちら 📩】お仕事の相談のある方は、下記のフォームよりお気軽にご相談ください。 https://forms.gle/G5g1SJ7BBZw7oXYA7 もしもメールでの問い合わせの方がよろしければ、下記のメールアドレスへご連絡ください。 info*galirage.com（*を@に変えてご送付ください） 🎁 「生成AIの社内ガイドライン」PDFを『公式LINE』で配布中 🎁 「LINEで相談したい方」や「お問い合わせを検討中の方」は、公式LINEでご連絡いただけますと幸いです。（期間限定で配信中なため、ご興味ある方は、今のうちに受け取りいただけたらと思います^^） https://lin.ee/3zRuqKe おまけ①：生成AIアカデミーより専門的な「生成AIエンジニア人材」を目指しませんか？そんな方々に向けて、「生成AIアカデミー（旧：生成AIエンジニア
- LLM
- あとで読む
- LangChain
- ChatGPT
- python
- AI
- 機械学習
- データ
Fastlyが大規模障害の経緯を公開、原因はソフトウェアのバグ。障害を1分以内に検知し、49分でおおむね復旧させたと報告
- 208 users
- www.publickey1.jp
- テクノロジー
- 2021/06/09
Fastlyが大規模障害の経緯を公開、原因はソフトウェアのバグ。障害を1分以内に検知し、49分でおおむね復旧させたと報告 CDNベンダ大手のFastlyが日本時間6月8日夕方に障害を発生、その影響は国内にもおよび、メルカリや楽天市場、Amazon.co.jp、Twitter、ABEMAなど多くのサービスに接続できないなどの障害が発生しました。 We identified a service configuration that triggered disruptions across our POPs globally and have disabled that configuration. Our global network is coming back online. Continued status is available at https://t.co/RIQWX0LWwl
リクルートのAWS基盤におけるTerraform運用_実践的な取り組みと組織づくり / HashiCorpVirtualStrategyDay_sudo
- 203 users
- speakerdeck.com/recruitengineers
- テクノロジー
- 2022/04/23
2022/04/21_HashiCorp Virtual Strategy Day Japan Vol.2での、須藤の講演資料になります
生産性を可視化したい！ / SUZURI's four keys
- 170 users
- speakerdeck.com/udzura
- テクノロジー
- 2021/06/17
@Pepabo Tech Conference #15 - ECプラットフォームSUZURIの開発の裏側 https://pepabo.connpass.com/event/215058/
Terraformerとしてコードを書いて思うこと | フューチャー技術ブログ
- 165 users
- future-architect.github.io
- テクノロジー
- 2021/10/29
こんにちは。TIGの伊藤です。この記事は秋のブログ週間2021の3日目です。はじめに私は普段会社でクラウドをまたいでTerraformを日々書いたり、メンバーに教えたりしています。もはや俗に言うプログラミング言語を書かずにここまで全振りしてきたくらいなので、比較的自信を持ってコードを書いて仕事をしています。特にここ最近はほぼ1からコード設計をして運用まで持っていくこともあり、「より腐りにくい、より息の長いコード」というものを考えるようになりました。Terraformだからこその「定期メンテを簡易にするためには」「より簡単に変更するためには」をひたすら突き詰めていった結果、アツい気持ちが生まれ、今回は筆を取っています。そんな私のアツい気持ちをしたためた今回の記事ですが、可能な限り例も添えつつ、いくつか解説できればと思います。公式にも実は載っているような内容もあったりしますが、日本語の記
- Terraform
- IaC
- あとで読む
- aws
- コード
- 運用
- 技術
- ブログ
- web
Amazon RDS/Auroraをクローンするシステムを作った話 - クックパッド開発者ブログ
- 162 users
- techlife.cookpad.com
- テクノロジー
- 2020/08/20
こんにちは、技術部SRグループの菅原です。最近、Ninja650からNinja1000に乗り換えました。パワーがあるせいで３速発進・４速発進が平気でできてしまい、シフトワークがどんどん下手になっています。精進したいものです。この記事では、Amazon RDS/Auroraをクローンするシステムを作った話を書きます。 Amazon RDS/Auroraをクローンするシステムサービス開発を行っていると、調査や検証でプロダクション環境で使われているデータベースが必要になることがあります。開発環境やステージング環境にもデータベースは存在するのですが、プロダクション環境のデータでしか再現しないバグの調査や、プロダクション環境のデータ量でのスキーマ変更の負荷の検証など、開発環境やステージング環境のデータベースではできない作業も多いです。しかし、オペレーションミスや個人情報へのアクセスを考えると、
- aws
- db
- RDS
- あとで読む
- aurora
- amazon
- database
- データベース
- 開発
- SQL
WebAssemblyでの機械学習モデルデプロイの動向
- 141 users
- www.tkat0.dev
- テクノロジー
- 2020/12/02
本記事はMLOps Advent Calendar 2020の 2 日目の記事です。 WebAssembly（Wasm）は機械学習モデルをデプロイする新たな手段になりうるでしょうか。この記事では、機械学習モデル（特に Deep Learning）を Wasm でデプロイする周辺技術の動向や内部の仕組みをざっくりと説明します。 Table of Contents tkat0 です。WebAssembly(Wasm)面白いですね。私も最近はyewでフロントエンドを書いて遊んでいます。Rust で React っぽいことできるのは新鮮で面白いです。 Wasm は、なんとなく速い JavaScript？とか機械学習で何に役立つの？とか思ってる方も多いと思います。しかし、Wasm はブラウザでの推論時に使えるだけでなく、機械学習モデルのサービングやエッジデバイスでの推論にも使えると知ったら驚き
- WebAssembly
- 機械学習
- wasm
- あとで読む
- machinelearning
- TensorFlow
- MLOps
- deploy
- tvm
- continuousDelivery
エラー監視とテスト体制への改善作戦 / PHPerKaigi2022
- 131 users
- speakerdeck.com/kazatohiei
- テクノロジー
- 2022/04/09
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
- テスト
- あとで読む
- 監視
- エンジニア
- 考察
- php
Summary of June 8 outage
- 122 users
- www.fastly.com
- テクノロジー
- 2021/06/09
Summary of June 8 outageWe experienced a global outage due to an undiscovered software bug that surfaced on June 8 when it was triggered by a valid customer configuration change. We detected the disruption within one minute, then identified and isolated the cause, and disabled the configuration. Within 49 minutes, 95% of our network was operating as normal. This outage was broad and severe, and we
- fastly
- incident
- 障害
- あとで読む
- cloud
- trouble
- network
監視論～SREと次世代MSP～
- 121 users
- speakerdeck.com/qryuu
- テクノロジー
- 2020/09/13
ITシステム監視を何故行うのかなぜ監視からオブザーバビリティーが求められるのか次世代MSP、今後の監視エンジニアに求められる能力とは
- SRE
- 監視
- あとで読む
- slide
- Technology
SRE の原則に沿ったトイルの洗い出しとトラッキング | Google Cloud 公式ブログ
- 115 users
- cloud.google.com
- テクノロジー
- 2020/02/21
※この投稿は米国時間 2020 年 2 月 1 日に、Google Cloud blog に投稿されたものの抄訳です。作業効率を検証するために Google のサイト信頼性エンジニア（SRE）が使用している主な測定指標の一つが、日々の時間の使い方です。長期間のエンジニアリングプロジェクトのために時間を確保する必要がありますが、エンジニアには Google のサービスを稼働し続ける責任もあり、そこにも手作業が生じることがあります。Google の SRE は、いわゆる「トイル」に費やされる時間を勤務時間の 50% 未満にすることを目指しています。では、トイルとは何でしょうか。トイルに邪魔されずに開発スピードを維持するには何をすべきでしょうか。本稿ではこれらの問いについて見ていきます。まずトイルの定義ですが、『Site Reliability Engineering』の第 5 章には次の
- SRE
- あとで読む
- google
- cloud
- WEBサービス
- blog
DevOpsトポロジー
- 98 users
- www.ryuzee.com
- テクノロジー
- 2022/04/11
チームトポロジー価値あるソフトウェアをすばやく届ける適応型組織設計著者／訳者：マシュー・スケルトン、マニュエル・パイス、原田騎郎、永瀬美穂、吉羽龍太郎出版社：日本能率協会マネジメントセンター発売日：2021-12-01単行本：280ページISBN-13：9784820729631ASIN：4820729632 今日はこの「チームトポロジー」の元となったDevOpsトポロジーについて紹介します。このアイデアは2013年に著者の1人であるマシュー・スケルトンが自身のブログに書いた記事をまとめたものです。 2013年頃といえばDevOpsが流行しはじめた時期だと思いますが、このような時期から組織構造やチーム間のコミュニケーションモデルをロジカルに定義しようとしていたのは驚きです。チームトポロジーでは、このDevOpsトポロジーやその他の考え方を元にして、4つのチームタイプと3
- devops
- あとで読む
- SRE
- チーム
- 組織
- 開発
- Blog
75億ドキュメント以上のデータを保持するMongoDBを、Amazon EC2からMongoDB Atlasへ約3ヶ月で移設した方法 | CyberAgent Developers Blog
- 86 users
- developers.cyberagent.co.jp
- テクノロジー
- 2021/06/17
75億ドキュメント以上のデータを保持するMongoDBを、Amazon EC2からMongoDB Atlasへ約3ヶ月で移設した方法はじめにタップル SREの赤野、CAM SREの庭木です。タップルは2021年3月頃にMongoDB on Amazon EC2(以下EC2 MongoDB)からMongoDB Atlas(以下Atlas)への移設を行いました。今回はこの移設での取り組みについて紹介します。 Atlasへ移設することになった経緯・目的タップルでは定期的にキャパシティプランニングを目的とした負荷試験を実施しており、今後のDAU増加のシミュレーションに対してシステムのキャパシティが確保できるかを定期的に確認しています。タップルSREのキャパシティプランニングの取り組みについては、以前発表させていただいた資料があるのでこちらにも目を通していただけると幸いです。 2020年
- MongoDB
- db
- aws
- あとで読む
- Developers
- データ
- SRE
- ドキュメント
- JSON
- コマンド
マイクロサービスにおけるAZ間通信のコスト大幅削減した話 with Istio Locality Load Balancing - Gunosy Tech Blog
- 85 users
- tech.gunosy.io
- テクノロジー
- 2022/08/24
広告技術部のUT@mocyutoです。大幅コスト削減シリーズ第二弾です。前回はこちら tech.gunosy.io 今回はアベイラビリティゾーン（AZ）間通信のコストをIstioのlocality load balancingを使って削減した話になります。概要 Istioとはどのようにコスト削減したかまとめ概要みなさんはマイクロサービスを導入しているでしょうか？最近はモジュラモノリスが流行り始めている雰囲気を感じてきていますが、弊社の広告配信サーバは以下のようなマイクロサービス化された設計（と言っても2つのサービスしかないのですが）になっています。構成図一般的にクラウドプロバイダ上で構築している場合、耐障害性を高めるために複数AZ、複数リージョンに分散させることが基本になるかと思います。弊社では、単一リージョン複数AZに分散させて稼働しています。リージョン間の通信に
- Istio
- envoy
- あとで読む
- 設計
- 設定
- Cloud
- サービス
- development
分析基盤と組織のあり方 - DeNAの事例
- 79 users
- speakerdeck.com/dena_tech
- テクノロジー
- 2020/09/18
今回のテーマは「分析基盤をうまく組織に浸透させる方法」です。「分析基盤を浸透させていく上で、分析基盤を担う組織(分析基盤組織)がどのように形を変えていったか」という内容です。組織設計の参考になれば幸いです。
- 組織
- DeNA
- あとで読む
- platform
- architecture
- analysis
- 分析
- slide
- data
なぜセキュリティを言い訳にアジリティが犠牲になるのか - 流沙河鎮
- 77 users
- bering.hatenadiary.com
- テクノロジー
- 2023/04/04
ここ数年、アジリティとセキュリティ(あるいはガバナンス)の両立について考える機会が多い。伝統的で規模の大きい企業にありがちな傾向として、セキュリティやガバナンスを確保するためにはシステムの開発/運用が鈍重、高コスト、不自由になったとしても已む無しとする思想がしばしば見受けられる。結果として例えば簡単な仮想サーバ１つを用意するだけでも数ヶ月の納期と膨大な工数を要するとか、世の中で当たり前に活用されている技術やプロセスが許可されない/導入に非現実的な手続きを要求されるといった状況が生まれる。確かにシステムの安全性を適切にコントロールすることは重要である一方で、論理的に考えれば「セキュリティのためのビジネス」ではなく「ビジネスのためのセキュリティ」なのだから、セキュリティを確保するためにビジネスの成功が妨げられてしまっては本末転倒に思える。しかし実際には「セキュリティのためなので仕方がない」と
Kaggleの学習から投稿までをAWS, GitHub Actionsを使って自動化する - kanayamaのブログ
- 71 users
- tepppei.hatenablog.com
- テクノロジー
- 2020/07/19
金山（@tkanayama_）です。先日終了したKaggleの"M5 Forecasting"というコンペに参加した際、クラウドやCI/CDの勉強も兼ねて、AWS, GitHub Actionsを使って遊んでみました。免責 N番煎じだったらすみません。一応、同じことをやっているネット記事は見つかりませんでした。私はクラウドなど勉強中の身分ですので、もっといいやり方がある or 説明が間違っている、などありましたら教えてください。私がこのシステムを使って参加したコンペの順位は5,558チーム中1,000,000,000位だったので、Kaggleで勝てるかどうかは別問題のようです :pien: この記事のゴール下記のようなシステムを構築することをゴールとします。ユーザーがやることは2つ（図中でユーザーから伸びている黄色矢印）で、実装したコードをgit pushし、 AWSコンソール
- kaggle
- aws
- github
- docker
- あとで読む
- 学習
- Amazon Web Services
- techfeed
GitHub - openstatusHQ/openstatus: 🏓 The open-source synthetic monitoring platform 🏓
- 71 users
- github.com/openstatusHQ
- テクノロジー
- 2023/10/07
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- 監視
- あとで読む
- monitoring
- OSS
- github
- library
- *あとで読む