ぜんぶの俳句のデータベースです
膨大な日本酒から好みの一品を探せるデータベース「さけのわ」で、都道府県別に味わいの特徴を示した解析結果が見られるようになりました。地域ごとの傾向の違いが興味を引きます。 全国の日本酒の傾向をチャート化。宮崎・鹿児島・沖縄は日本酒の種類が少ない(さけのわに投稿されている銘柄はそれぞれ1種類だけ)ためか、「データ不十分」とされています サイトやアプリ版(Android版/iOS版)に寄せられた日本酒の感想を解析し、「華やか」「芳醇」「重厚」「穏やか」「ドライ」「軽快」の6要素でレーダーチャート化。統計処理により、東北や北陸、中国地方など、地方単位で傾向に類似性のあることが見えています。 若干の違いはありますが、近隣地域のチャートに似た傾向が見られるケースが 従来から言われる傾向と、チャートとで差異が生まれている地域も。例えば広島の日本酒は一般的に口当たりがやわらかく甘口と言われることが多いとの
「ユーザー目線」のシステムを目指して RDBが従来の階層型DBに比べて優れていた点はいくつか挙げることができますが、シェアを伸ばすうえで最も大きな影響は、ユーザーが使いやすいデータ構造とインタフェースにこだわったことです。すなわち、「テーブル」と「SQL」の発明です。 RDBでは、すべてのデータを「テーブル」というただ一つのデータ形式によって表現します。テーブルは、見た目が「二次元表」に似ているため*3、Microsoft ExcelやGoogle ドキュメントなどのスプレッドシートを使い慣れた人が見ると、データを格納する方法が直観的にイメージしやすいという利点があります。実際、こうした二次元表によるデータ管理は、Excelなどのソフトウェアが登場する前から一般的な方法だったため、RDBが登場した当時の人々にとっても受け入れやすいものでした。 テーブルが画期的だった点は、もう一つあります。
米国の二大音楽著作権管理団体であるASCAPとBMIが両者の作品データベースを統合するというプレスリリースを行ないました。JASRACの独占に近い日本の音楽著作権管理とは異なり米国ではASCAPとBMIが拮抗しています(たとえば、ビヨンセはASCAP、レディー・ガガはBMI)。さらに、ボブ・ディラン等の楽曲を管理するSESACという団体もあります。 複数の団体が競争することで独占の弊害を防げるという利点はありますが、楽曲を利用する立場としては、どの作品がどの団体の管理下にあるかを知ることが面倒であるという弊害があります。作品データベースを統合することで、この弊害が大きく軽減されると思われます。 フェーズ1のシステムは2018年末までにローンチされる予定であり、将来的にはウェブAPIの提供や他のデータベースの統合(少なくともSESACのデータは統合して欲しいですね)が予定されています。また、
東北大学などは18日、日本人3554人のゲノム(全遺伝情報)を解析し、公的機関で世界最大級のデータベースを作ったと発表した。日本人特有の特徴も見つかった。今後、1万人に数人の割合で発症する希少な病気と遺伝子の特徴との関係に関する研究を進め、原因究明に役立てたいとしている。 【写真】ゲノムを解析する次世代シーケンサー(東北大提供) データベースは東北大が岩手医科大や日本医療研究開発機構と連携して作成。日本各地の健康診断などの際に同意を得られた3554人のゲノムを解析した。 ヒトのゲノムは30億個の遺伝情報があるが、今回の解析で、個人によってわずかな違いがある場所が約3710万個あることがわかった。このうち約2690万個は国際データベースにもない新たな情報で、半数以上が日本人に特有とみられるという。
この記事はVASILY DEVELOPERS BLOGにも同じ内容で投稿しています。よろしければ他の記事もご覧ください。 こんにちは、バックエンドエンジニアの塩崎です。 今まではiQONの全文検索用のインデックスには形態素解析だけを用いていましたが、先日Ngramも併用することで検索を改善しました。 その結果、検索結果のヒット数が向上し、なおかつ検索ノイズの増加を軽微なものに抑えることができました。 この記事では、Ngramを併用することのメリット、およびそれをApache Solrで利用する方法について紹介します。 欲しい情報が見つからないとは そもそも、「検索したけど欲しい情報が見つからない状態」とはどのような状態でしょうか? ここではその状態を以下の2つの状態に分解して考えてみます。 欲しい情報の数が少ない 1つ目の状態は「欲しい情報が検索結果中に少ない」状態です。 例えば、旅行情報
「Google Cloud Spanner」発表。地球規模の大規模分散環境で稼働するミッションクリティカルなリレーショナルDB。NoSQL並のスケーラビリティでSQL対応、トランザクション処理を実現 Googleは、クラウド上で高度なスケーラビリティを実現する、ミッションクリティカルな業務に対応したリレーショナルデータベースサービス「Google Cloud Spanner」を発表しました。 Google Cloud Spannerは、地球規模の大規模分散処理データベースとして、NoSQL並の非常に高いスケーラビリティと高い可用性、そして高速な処理を実現しつつ、SQLに対応。強い一貫性を持つトランザクション処理も実現。企業のミッションクリティカルな業務にも使えると説明されています。 地球規模に分散したリレーショナルデータベース 一般に、ミッションクリティカルな業務に対応したリレーショナルデ
以前書いたこの記事。 これを書くのに使った元データを公開することにした。 2016/10/08時点で1917年から2016年10月までの100年分、10,255作品のタイトルと開始年月日が分かる。 Dropbox - animedb(shared).xlsx - Simplify your life 2016/11/19 更新 githubでcsvファイルを配布するようにした。Excelデータよりこっちの方が新しい。 github.com github 要望があったのでgithubでも公開した。 現在はこちらが最新版である。今後もマスターデータはgithubで管理していく。 github.com ライセンス 本ソフトウェア(ソースコードおよびデータベース)の利用はMIT ライセンスに基づく。また、メディア芸術データベース利用規約に準ずること。 使い方 Dropboxのページで見るなり、ダウ
アニメのタイトルを入力する際、変換に手間取ったことはないだろうか。 この記事を読めば、そのような悩みから解放されることになる。 俺は君たちに辞書を配りたい。 アニメタイトル100年分が収録された辞書を。 2016/11/27 更新 辞書データ更新 2016/11/15 更新 辞書データをgithubに上げたことを追記 2016/11/15 更新 416作品追加 タイトルや読み仮名の修正 最強のアニメ辞書 次の文章には誤りがある。 今期で一番おもしろいスポーツアニメは『競女!!!!!!!』である。 わかっただろうか。 正解は「"!"の数が1つ足りない」だ。 このようにアニメのタイトルというものは、正しく入力するのが難しいものもある。それは『競女!!!!!!!!』のように数を間違えやすいものや、『侍霊演武:将星乱』のように読みが分かりにくい*1もの、あるいは『魔法少女なんてもういいですから。』
2016年4月に始まるアニメの数は50本オーバーで、毎年続々と登場する新作アニメを追いかけていると一体全体自分はどのアニメを何話まで見たのか、がわからなくなっても何ら不思議はありません。そんな「毎クールたくさんアニメを視聴している」という人にぴったりな、どのアニメをどれだけ見たのかを簡単に管理できるツールが「Annict」です。 Annict | アニクト - 見たアニメを記録して、共有しよう https://annict.com/ 「Annict」のトップページには「今期の人気アニメ」と…… 「人気アニメ」が並んでおり、その横にはユーザーの視聴記録がタイムライン形式で表示されています。 というわけでさっそくAnnictを使用してみます。まずはトップページ上部にある「アカウント登録して記録する」をクリック。 Annictを使用するにはTwitterもしくはFacebookのアカウントと連係
詳細 裁定申請を行う前に以下の1~3の「相当な努力」を行うこととされていますが,過去に裁定が行われたことのある著作物等については以下の(1)(2)いずれかのデータベースを検索することで「相当な努力」のうち1及び2を省略することができます。(詳細については,「裁定の手引き」7~15ページ参照) 「相当な努力」の内容 1.権利者情報を掲載する資料の閲覧(名簿・名鑑等の閲覧又はインターネット検索) 2.広く権利者情報を保有していると認められる者への照会(著作権等管理事業者等への照会及び関連する著作者団体への照会) 3.公衆に対する権利者情報の提供の呼びかけ(日刊新聞紙への広告掲載又は著作権情報センターウェブサイトへの広告掲載) 【統合版】 昭和47~57年度(88KB)/ 平成1~11年度(1.9MB)/ 平成12~22年度(27MB)/ 平成23~30年度(68MB)/ 令和1~5年度(7MB
文化庁では,平成27年3月に公開した「メディア芸術データベース(開発版)」サイトのリニューアルを行いますので,お知らせいたします。 1.概要 文化庁では,メディア芸術作品に係る保存と活用を促進するため,マンガ,アニメーション,ゲーム,メディアアートの作品情報や所蔵情報を整備した「メディア芸術データベース(開発版)」を平成27年3月に公開しております。 このたび,本データベースのリニューアルを別紙のとおり行います。 2.リニューアルサイト公開要旨 サイト名称:メディア芸術データベース(開発版) サイトURL:http://mediaarts-db.jp リニューアルサイト公開日:平成28年3月1日(火)10:00(予定) 3.リニューアルの概要 ・メディアアート分野データベースの公開開始 ・ゲーム分野データベースのデザインリニューアル及び機能改修 ・アニメーション分野データベースの機能改修
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く