[B! database] imai78のブックマーク

imai78 id:imai78

databaseに関するimai78のブックマーク (88)

システムはどのくらいのデータを扱うか。 - きしだのHatena
ちょっと気になったので調べてみたら、営業のためのデータはどんな業態でも一社だいたい月10億件くらいで頭打ちっていう感じになった。追記 2011/9/17 15:54 業態を比べたいので、国内の最大シェアっぽい企業で比べてます。世界に広げたとしても、実業にからむなら、だいたいは会社が分かれてシステムも分けるだろうし、トヨタの販売台数が世界770万台、国内130万台でせいぜい6倍というのを見ても、一体だとして10倍の差は出ないし。トヨタの2011年国内販売台数、130万台の見通し | ロイター追記ここまでコンビニ最初にたくさんデータが発生しそうだと思って考えたのがコンビニ。フランチャイズ協会のデータによると、全国の店舗数が43690店舗、月間客数が13億人で、客単価が600円。 http://www.jfa-fc.or.jp/particle/42.html 一番でかい7-11の
imai78 2011/09/19
performance

scalability

database
リンク
Oracle、「MySQL 5.5」をリリース　Webアプリ向けとしてOracle Databaseと差別化
Oracle、「MySQL 5.5」をリリース　Webアプリ向けとしてOracle Databaseと差別化 Windowsでは前バージョンより読み／書き性能が1500％向上したという「MySQL 5.5」を、Oracleは「Microsoft SQL Serverに代わる高性能でコスト効率のいいデータベース」とうたっている。米Oracleは12月15日（現地時間）、オープンソースデータベースの最新版「MySQL 5.5」をリリースしたと発表した。MySQLのサイトから無料でダウンロードできる。 MySQLのコミュニティーエディションのリリースは、Oracleによる米Sun Microsystems買収完了後、初となる。Oracleには自社製品のデータベース「Oracle Database」があるため、買収当時オープンソースコミュニティーはMySQLの将来を懸念していたが、Oracleは
imai78 2010/12/23
database

mysql

news
リンク
Java製のデータベースマネージャ·Druid MOONGIFT
DruidはSQLやコード出力にも対応したデータベース管理ソフトウェア。 [/s2If] DruidはJava製のオープンソース・ソフトウェア。NoSQLやO/Rマッパーなどの登場によってデータベース管理の重要性が失われているように見える。だがより高速、より堅牢なシステムを構築する上で適切な設計管理は重要だろう。テーブル情報データベースを管理する場合、そのスキーマ情報を別なツールで設計するのが一般的だ。GUIで設計し、メンテナンスしたりSQL発行ができると便利だ。今回はマルチプラットフォームで動作するDruidを紹介しよう。 Druidはデータベースに接続し（接続しなくとも利用できる）、そのスキーマ情報を取り込むことができる。さらにリレーションの状態をビジュアル的に確認することもできる。テーブルの作成はもちろん、ビューやトリガーの作成、一覧での管理も可能だ。 E-Rビューテーブル内の
imai78 2010/12/19
database

java

tool

gui
リンク
データベースの差分表示·DiffKit MOONGIFT
DiffKitはデータベース/CSVファイル間の差分を抽出する。 [/s2If] DiffKitはJava製のオープンソース・ソフトウェア。適切なデータベース管理を行っていない状態で運用を続けていると、いつの間にか開発環境と実行環境で構造の不一致がおこる。カラムの順番が違う程度ならいいが、なぜあるのか分からないカラムが出てきたりすると厄介だ。データベースの構造不一致は様々な問題を引き起こす可能性がある。早めの対処が必要だ。そのためにはまず現状分析を行う必要があるだろう。手作業で行う必要はない、DiffKitを使えば容易に知ることができる。 DiffKitは二つのデータベース間における構造不一致を表示するためのツールだ。Diffツールのデータベース版ともいえる。特徴としてJDBCによるデータベース接続をサポートする他、CSVファイルにも対応していることが挙げられる。片方がCSV、片方がデー
imai78 2010/12/19
database

diff

tool
リンク
R&Dトレンドレポート記事一覧 | gihyo.jp
第25回マッシュアップ開発のススメ［その11：モバイル版アプリケーションを作ろう⑤］脇本武士 2011-10-19
imai78 2010/11/16
nosql

database

rdbms

kvs
リンク
第1回　記憶装置のトレードオフとバッファの考え方―すべてをとることができないとき　（1） | gihyo.jp
はじめに意思決定に関する最初の原理は、「⁠無料の昼食（フリーランチ）といったものはどこにもない」ということわざに言い尽くされている。自分の好きな何かを得るためには、たいてい別の何かを手放さなければならない。意思決定は、一つの目標と別の目標の間のトレードオフを必要とするのである。 ─⁠─ N.Gregory Mankiw この講座は、システム開発で必ずといってよいほど利用されるリレーショナルデータベース管理システム（RDBMS）について、普段あまり意識しない内部のアーキテクチャやストレージのしくみについて解説することで、みなさんのデータベースについての理解を深めてもらうことを目的としています。開発現場でみなさんを助ける知識が身につくよう、理論と実践のバランスを取りながら進めていきたいと考えています。また、基本的に特定のDBMSには依存しない、汎用的な内容を心がけています。もちろん、そうは
imai78 2010/10/29
database

rdbms

tutorial

tips
リンク
［次世代DB編］分散KVSで正規化をしてはいけない
クラウド上のデータベースとして、分散型のキーバリューストア（分散KVS）を用いることが多くなった。分散KVSは、スケーラビリティーに優れており、特にユーザー数が多いシステムでは利用価値が高い。ただし、分散KVSにはいくつかの制約があり、システム開発に利用する際には、これまでの“RDBMS脳”をいったんリセットする必要がある。中でも、RDBMSでは真っ先に考慮していた「正規化」については、分散KVSでは原則として行ってはいけない。分散KVSの四つの特徴なぜ分散KVSでは正規化をしてはいけないのか。これを理解するには分散KVSの特徴を押さえる必要がある。分散KVSには、大きく四つの特徴がある（図1）。一つは、分散KVSでは問い合わせにキーを使って、バリュー（値）を取得することだ。データ構造が単純なので、データの取り出し時間が短くて済む。PerlやPHPの連想配列や、JavaのMap、C
imai78 2010/07/27
database

kvs

rdbms

tips
リンク
ウノウラボ Unoh Labs: 国産MySQLストレージエンジン「Spider」の作者、斯波健徳氏に聞く
こんにちは。中村です。 MySQLにはMyISAM、InnoDB、CSVなどのいくつかストレージエンジンがありますが、皆さんはSpiderというストレージエンジンを聞いたことはありますでしょうか。Spider Storage Engineは斯波健徳さんにより作成されたDatabase Shardingを可能にするストレージエンジンでMySQL 5.1で利用可能です。先日、某集まりで斯波さんとお会いしたときにSpiderを作っているということを教えてもらったので、早速詳しい内容を教えてもらうことにしました。 ※Spiderについての説明資料はMySQLカンファレンス 2009にて斯波さんが発表されたときのスライドがあります。スライドの直リンク（zip） Spider Storage Engine について posted by (C)フォト蔵 Spider Storage Engineとは？
imai78 2010/07/20
database

mysql

spider

storage engine

programming

これはすごい
リンク
Google App EngineがSQLデータベースをサポートへ。エンタープライズ向けサービスを拡充
Google App EngineがSQLデータベースをサポートへ。エンタープライズ向けサービスを拡充グーグルは5月19日（現地時間）に米サンフランシスコで開催されたイベント「Google I/O」の基調講演で、エンタープライズ向けにフォーカスした「Google App Engine for Business」を発表しました。その内容を紹介しましょう（基調講演の内容は、記事「［速報］Google I/Oで発表された4つのポイント：VP8オープンソース化／Chrome Web Store／VMwareとの協業／Google App Engine for Business」をご覧ください）。基調講演で最後の発表者として壇上に立ったのは、グーグルのKevin Gibbs氏。App Engineがエンタープライズに受け入れられるようにするためには、いくつかのバリアを乗り越えなければならないと語
imai78 2010/07/01
google app engine for java

google

database
リンク
SSD専用に設計された「ReThinkDB」、ロックもログも使わない新しいリレーショナルデータベースのアーキテクチャ
SSD専用に設計された「ReThinkDB」、ロックもログも使わない新しいリレーショナルデータベースのアーキテクチャ SSDがHDDに代わるストレージとして普及しようとしていることを背景に、SSDに特化したまったく新しいアーキテクチャを備えたリレーショナルデータベースを開発しようとしている企業があります。「ReThinkDB」です。昨年7月に、PublickeyではReThinkDBの概要を記事「SSDに最適化したデータベース「RethinkDB」、ロックもログも使わずにトランザクション実現」で伝えました。その記事の中では、ReThinkDBがロックを使わずにトランザクションを実現し、データベース利用中でもスナップショットがとれ、また異常終了しても容易に復帰できる機能を備えている、といったことを紹介しました。 4月に米サンタクララでに行われた「MySQL Conference & Ex
imai78 2010/07/01
rdbms

ssd

rethinkdb

database
リンク
BigQueryってなんぞ？ - スティルハウスの書庫の書庫
Google I/O 2010では、Google Storageと合わせて利用する新機能「BigQuery」が発表されました（これもApp Engineとは個別のプロダクトです）。ひとことで言えば「何100億件のデータも数秒〜数10秒で集計できる、大規模並列クエリサービス」です。既存のOLAPやデータウェアハウスに相当するもので、更新処理には使えません。 MapReduceとはどう違う？大規模なデータセットに対して多数のサーバで並列処理するという点ではMapReduceに似ていますが、処理結果がすぐに得られる点、そしてSQLっぽいクエリ言語で表現できる集計処理しか実行できない（mapperやreducerを定義してデータを任意の方法で加工したりできない）点がMRとは異なります。MRよりさらに高水準の分散処理サービスです（MR＋Hiveに近いかもしれません）。リンク集 BigQuery
imai78 2010/07/01
bigquery

mapreduce

google

database
リンク
NoSQLを超えるSQLデータベース「VoltDB」。Cassandraとベンチマーク対決！
「多くのOLTPデータベースは30年前の設計を基にしており、今日の“Webスケールな”データベースの負荷を想定していない。これら伝統的なデータベースは、処理時間の90％以上がログ、ロック、ラッチ、バッファ制御といったオーバーヘッドに費やされ、しかもそれらによって限られた性能やスケーラビリティしか実現できていない」 Ingresの開発者でありInformixのCTOなどデータベースベンダの要職を歴任したデータベース研究者の大御所、マイケル・ストーンブレイカー氏が開発したVoltDBはプレスリリースでこのように既存のリレーショナルデータベースの欠点を示した上で、インメモリデータベースをベースにこれらのオーバーヘッドを除去し、ACIDによるデータ一貫性を維持しつつ大きな性能向上とスケーラビリティを実現したと説明されています。 SourceForge.jpの記事「「NoSQL」を上回る性能を目指す
imai78 2010/06/30
benchmark

voltdb

cassandra

performance

nosql

database
リンク
Hadoopは企業のための新たな情報分析プラットフォームとなる、とCloudera
グーグルが大規模分散システムのために用いているMapReduceという技術を、オープンソースとして実装したJavaベースのソフトウェア「Hadoop」です。 Hadoopは当初、Yahoo!やFacebook、Facebookといったネット企業が数テラバイト、ペタバイトにおよぶ大規模なログなどを分析するのに利用していましたが、現在ではVISAやJP Morgan Chase、China Moblieなど一般の企業でも大規模なデータ処理にHadoopを用いています。多くの処理がネットで行われるにつれ、「Big Data」と呼ばれる大規模データは処理のニーズはさまざまな企業に広がっています。 Hadoopは新しいデータ分析プラットフォームになる Hadoopの商用ディストリビューションを提供する「Cloudera」は、Hadoopをあらゆる企業、組織の情報分析プラットフォームにするというビジョ
imai78 2010/06/29
hadoop

data

datastore

database

kvs

bi
リンク
クラウド上のリレーショナルデータベースはなぜ難しいのか？ BASEとCAP定理について
今週18日からマイクロソフトがラスベガスで「MIX09」を開催します。Windows 7やWindows Azureが発表された昨年秋のPDC（Professional Developers Conference）とは異なり、MIXはWebデザイナーとWebデベロッパー向けのイベントです。ところで、デザイナーとデベロッパー向けのイベントといえばアドビシステムズのイベントが有名。その名称はたしか「MAX」ですよね......。さて。MIX09ではWindows Azureの料金体系の発表があるかもしれないといわれています。もし発表されれば、IT系メディアのヘッドラインを飾ることでしょう。僕が注目しているのは、先日「マイクロソフトがクラウドでリーダーシップを握る可能性が高まる」で書いた、SQL Server完全互換の「SQL Data Services」（SDS）についての具体的な内容の
imai78 2010/06/28
datastore

database

cap定理

base

acid

まとめ
リンク
[ThinkIT] 第2回：MyISAMとInnoDB (1/3)
今回は、MySQLのストレージエンジンの中でも特に有名な「MyISAM」と「InnoDB」の2つを取り上げます。MyISAMはMySQLのデフォルトストレージエンジンで、ストレージエンジンを指定せずにテーブルを作成するとMyISAMが選択されます。もう一方のInnoDBエンジンは、MySQLに豊富なトランザクション機能を提供するストレージエンジンとして有名です。まずはそれぞれのテーブルファイルの構造について解説し、最後にInnoDBのトランザクションについて解説します。各ストレージエンジンのファイル構造を説明する前に、前知識としてMySQLのディレクトリ構造について説明します。 MySQLのデータベースディレクトリには、バイナリログと呼ぶデータベースの更新情報を格納するファイルと、2つのサブディレクトリが存在します（図1）。「mysql」ディレクトリには権限テーブルと呼ばれるMySQ
imai78 2010/06/23
mysql

innodb

myisam

database

tutorial
リンク
PEAR MDB2でPHPからデータベースを操作する
CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。
imai78 2010/06/21
php

database

mdb2

tips

pear
リンク
グラフDB Neo4j
今やリレーショナルデータベース全盛の時代である。どんなシステムもRDBなしには成り立たなくなっている。しかし、RDBは本当に便利なのだろうか？例えば、いまはやりのSNSを考えてみよう。それぞれのユーザーは他のユーザーとネットワーク的につながりをもっている。そして、そのつながりは友人関係だったり仕事仲間だったりする。 RDBではそれぞれの表の属性もあらかじめ定義される必要があり、後で属性を追加することは難しい。しかし、SNSのような人間関係を表現するようなもので事前にデータ構造を予測することができるだろうか。例えば最初は仕事で知り合った人間でも友人になることがあるし、恋人同士だったのが別れてしまって他人同士になってしまうこともあるだろう。このようなダイナミックなデータ構造はRDBでは表現するのが難しいだろう。しかし、グラフDBはこのような用途に向いたDBである。例えば、T
imai78 2010/06/21
nosql

kvs

neo4j

java

graph db

database

programming

tutorial
リンク
InfoQ: グラフデータベース、NOSQL、Neo4j
原文(投稿日：2010/05/12)へのリンクはじめにデータモデルにはいろいろあるが、80年代以降、主流になっているのはリレーショナルモデルだ。このモデルにはOracle、MySQL、MSSQLなどの実装があり、RDBMS（リレーショナルデータベース管理システム: Relational Database Management System）と呼ばれることもある。しかし最近になって、リレーショナルデータベースを使うことで問題が起こるケースが増えている。リレーショナルモデルによるデータモデリングには弱点と問題があり、複数サーバに及ぶ水平方向のスケーラビリティと膨大なデータの扱いに制約があるためだ。これらの問題の要因には、世界中のソフトウェアコミュニティが注目している2つのトレンドがある。ユーザ、システム、センサーによって生み出されるデータの指数的な増加。Amazon、Google、その他
imai78 2010/06/21
nosql

kvs

neo4j

java

graph db

database
リンク
クラウドの力を引き出す分散データベース
はじめに本記事では、プライベート・クラウドなどで実際に利用可能な分散型データベースの一例として、Apache Cassandraを紹介します。機能的な特徴やアーキテクチャの概要だけでなく、運用する上で必要となるクラスタとノードの操作方法（ノードの追加／削除、バックアップなど）についても説明します。 Apache Cassandraは、Amazon Dynamoと Google BigTableの特徴を統合した分散型データベースと言われています。クラウド向け分散データベースの事例を参照していただければ、より特徴を理解しやすくなると思います。 Apache Cassandraとは Apache Cassandraは、Amazon Dynamoの特徴である“耐障害性の高さやデータの分散保持を考慮した分散特性”と、 Google BigTableの特徴である“ColumnFamilyをベースと
imai78 2010/06/19
cassandra

tutorial

database
リンク
ウノウラボ Unoh Labs: PHPで暗号化・復号化あれこれ
GT Nitro: Car Game Drag Raceは、典型的なカーゲームではありません。これはスピード、パワー、スキル全開のカーレースゲームです。ブレーキは忘れて、これはドラッグレース、ベイビー！古典的なクラシックから未来的なビーストまで、最もクールで速い車とカーレースできます。スティックシフトをマスターし、ニトロを賢く使って競争を打ち破る必要があります。このカーレースゲームはそのリアルな物理学と素晴らしいグラフィックスであなたの心を爆発させます。これまでプレイしたことのないようなものです。 GT Nitroは、リフレックスとタイミングを試すカーレースゲームです。正しい瞬間にギアをシフトし、ガスを思い切り踏む必要があります。また、大物たちと競いつつ、車のチューニングとアップグレードも行わなければなりません。世界中で最高のドライバーと車とカーレースに挑むことになり、ドラッグレースの王冠
imai78 2010/06/08
google apps

google spreadsheets api

google excel

programming

tips
リンク
1 2 3 4 5 次のページ