タグ

画像処理に関するmikage014のブックマーク (25)

  • 渋谷の交差点から人をじわじわ消す

    渋谷に人がいない写真を撮りたい 渋谷のスクランブル交差点みたいな場所で、人のいない写真を撮るための方法の1つは、長時間露光だ。 カメラのシャッターをあけっぱなしにして何秒間も撮影すると、なんとなく人がいなくなったような写真を撮ることができる。 こんな感じの写真、見たことありますよね。 長い時間やればやるほど人が消えるんだけど、それでも人の足元みたいにあまり動かない部分がぼやーっと残ってしまう。 これをなんとかする方法を考えてみた。 もっとも長い時間を占めていた色をそのピクセルの色とする ふつうの長時間露光は、言ってみればピクセルごとに色を時間で平均したものだ。あるピクセルが2秒間は真っ白、つぎの3秒間は真っ赤だったとすると、露光の結果はその平均としてピンク色になる。 長時間露光で、ところどころ色がにじんだ感じになっちゃうのはそのためだ。 そこで、ピクセルごとに一番長い時間を占めていた色を選

    渋谷の交差点から人をじわじわ消す
  • SSDで道路の損傷を検出した - Qiita

    はじめに SSD(Single Shot Multibox Detector)で道路の損傷を検出しました. 作業環境等に関しては株式会社パソナテックさんにご協力いただきました. なお成果物は学習済みモデルとともにGitHubに公開されています. 不具合もまだ複数あると思いますので,気軽にissueを立てていただければと思います. やったことを最初から文章で説明するより,まずは成果物を見ていただいたほうが早いと思うので,デモをお見せします. このように,横断歩道やセンターラインのかすれ,陥没,ひび割れなどを検出することができます. 道路の損傷を検出する方法はいろいろありますが,画像認識を用いるならば,車で移動しながらスマホや車載カメラでリアルタイムに検出できると便利です. このような認識手法を採用するのであれば,デバイスの制約により,計算量が小さいモデルが求められます. 道路の損傷を物体認識

    SSDで道路の損傷を検出した - Qiita
  • AIを使用した無料の画像リサイズの拡大ソフトが凄い!解像度を最大16倍に! | デジタル@備忘録

    2017年10月21日に公開され世界中で話題になった画像拡大ソフト(Webアプリケーション)Let’s Enhanceがリメイクされましたのでご紹介します。 Photoshopよりも凄い無料の画像拡大ソフト 2022年現在は5枚まで無料で使用できます。数年前までは25枚まで無料で処理できたのですが、トライアル出来る枚数が減ってしまったようです。そこは少し残念。 とりあえず5枚は無料で試せますから気に入ったら、追加処理分を購入して処理することが可能です。 Let’s Enhanceはニューラルネットワークを使用して画像拡大をするWebソフトです。 マジックフィルターと書かれているものがLet’s Enhanceを使用して拡大したもの。 通常のソフトで行われている画像拡大と手法が異なり、最初にポートレートや風景、品など画像種類やタイプを認識。その上でネットワークを使用し画像タイプごとに自然な

    AIを使用した無料の画像リサイズの拡大ソフトが凄い!解像度を最大16倍に! | デジタル@備忘録
  • 画像処理の数式を見て石になった時のための、金の針 - Qiita

    $k$は定数で、だいたい0.04~0.06くらいです。Rの値によって以下のように分類できます。 Rが大きい: corner Rが小さい: flat R < 0: edge 図にすると、以下のようになります。 CSE/EE486 Computer Vision I, Lecture 06, Corner Detection, p22 これで手早くcornerを検出できるようになりました。ここで、corner検出についてまとめておきます。 cornerは複数のedgeが集まる箇所と定義できる 変化量をまとめた行列の固有ベクトルからedgeの向き、固有値の大きさから変化量の大きさ(edgeらしさ)がわかる 2つの固有値の値を基に、edge、corner、flatを判定できる 固有値の計算は手間であるため、判定式を利用し計算を簡略化する なお、Harrisはedgeの向きである固有ベクトルを考慮す

    画像処理の数式を見て石になった時のための、金の針 - Qiita
  • ごちうサーチ

    2.  火星や月から宇宙人の顔を見つけた  Nasa の画像をクラウドで処理 https://en.wikipedia.org/wiki /Face_on_Moon_South_Pole (Română தமிழ் 中文) http://target.lroc.asu.edu/qm3d/ o2w_3d_617653310_153_220_20 5_44_0/ 3.  飯テロ判定bot (Twitter @no_meshitero)  事を判定する bot だが、それ以外の画像も判定  複数の画像認識クラウドサービスの結果を統合 ▪ Google, IBM, Microsoft, docomo “一蘭の飯テロ画像です”

    ごちうサーチ
  • アイカツおじさんが『アイカツキャプチャ画像が何話の何分何秒のものか特定できるツール』を作成「謎技術すごい」「アイカツはSF」と人々を困惑させる

    meganeアイカツ垢 @AikatsuMegane 何気なく保存したアイカツのキャプチャ画像を、何話の何分何秒付近の画像か一瞬で特定するツール(全178話、劇場版も対応) Gochiusearchで作成しました。何気ない背景画像も全630万以上のフレームの中から一瞬で特定。なのにDBサイズはたったの27MB。すごい。 pic.twitter.com/eT0EH1ThN3 2017-07-30 14:21:25

    アイカツおじさんが『アイカツキャプチャ画像が何話の何分何秒のものか特定できるツール』を作成「謎技術すごい」「アイカツはSF」と人々を困惑させる
  • 機械学習で共有スペース利用状況の解析 - Qiita

    きっかけ 2017/05/08に僕が勤務するgifteeオフィスが移転しました。 新しいオフィスではソファー席やファミレス席など、 いろいろなタイプの共有スペースが増えました。 https://www.wantedly.com/companies/giftee/post_articles/64703 そこで、どのタイプの共有スペースがどれくらい利用されているか把握したい との要望があがってきたため、利用状況の取得方法について検討することにしました。 検討 利用状況の把握に人感センサーや、感圧センサーなどの使用も候補にあがりましたが、 人感センサーでは人数まではとれなさそうなこと、 感圧センサーでは席ごとにセンサーが必要になってしまうため、 共有スペース毎に定期的に写真を撮影して、そこに写っている人数を計測する方法にしました。 人数解析方法 画像から人数の取得については機械学習フレームワーク

    機械学習で共有スペース利用状況の解析 - Qiita
  • 富士通など、電力計の自動読み取りで高精度を確認--深層学習を活用

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 富士通とPFUは3月30日、中国電力とエネルギア・コミュニケーションズと共同で進めた電力量計読み取りに関する実証実験の結果を発表した。 実証実験は、発変電所巡視業務で電力量計の数値をタブレットのカメラを使って自動で読み取るもの。2016年10~12月に実施した。対象となった6カ所の変電所の電力量計にはアナログ式とデジタル式が含まれる。 実証実験では、アナログ式とデジタル式の両方の電力量計でいずれも高い認識精度を確保できたという。 メーター読み取りには、PFUが開発中のシステムを活用。このシステムは深層学習(ディープラーニング)技術を活用している。メーターにタブレットをかざすだけで自動で撮影し、メーターの数値を正確に認識する。学習データを

    富士通など、電力計の自動読み取りで高精度を確認--深層学習を活用
  • 日本語認識ライブラリのOCR系の記事まとめ - 珈琲駆動開発

    JPHacksというハッカソンで画像から日語を認識してテキスト化する機能をもったアプリを作成することになって、OCRが必要になって調べてみたのでリンクをまとめておく 参考記事 DOCOMO docomo developer support https://dev.smt.docomo.ne.jp/?p=mypage.api.index docomo api 画像認識要求 https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_docs_id=115#tag01 tesseract-orc 日語光学文字認識プログラム(OCR) nhocr を CentOS にインストール http://diary.overlasting.net/2010-07-01-3.html iOSで日語OCR!サンプルアプリ構築編〜iOS SDK 6.1 + tess

    日本語認識ライブラリのOCR系の記事まとめ - 珈琲駆動開発
  • Tesseract OCRで数字の認識 - danglingfarpointer's memoization

    オープンソースで最も認識精度が高いと言われている文字認識エンジン、Tesseractで数字を認識してみる。名刺の中の電話番号を認識する、という想定。OSはMac OS X. 画像の準備 名刺っぽいプリントアウトをスマホのカメラで撮影。 画像サイズは2592x1944. 人名や住所などは全くデタラメw tesseractのインストール tesseractをMacPortsでインストール。 sudo port install tesseract ソースコード 処理の流れとして、まず二値化を行い、次に文字認識を適用する。文字認識結果の出力とは別に、二値化の結果画像もtifファイルとして保存する。 文字認識では、数字といくつかの記号をホワイトリストとしている。なので、後に見るように、漢字やアルファベットなども無理やり数字として解釈してしまう。 認識結果の一文字ごとに確信度(confidence)が

    Tesseract OCRで数字の認識 - danglingfarpointer's memoization
  • 画像処理をやるなら知らないと損!OpenCVがわかる資料まとめ

    OpenCV(オープンシーヴィ)は多機能なコンピュータビジョンライブラリで、動画や画像の処理に幅広く利用できるさまざまな機能が実装されています。 動画・画像処理を用いたアプリやサービスを開発するために、OpenCVを学びたいと思っている方は少なくないのではないでしょうか。 そこで今回は、OpenCVが学べる資料(記事・サイト・スライド)を10個ご紹介します。 OpenCVを基礎から解説している資料を中心に紹介していますので、OpenCVの学習にぜひご活用ください。 OpenCVがわかる記事・サイト 10分で学ぶOpenCV超入門 / MetaArt http://iphone.moo.jp/app/?p=1101 「画像を読み込み表示する」「画像のサイズを変更する」「画像をグレースケール化する」「画像を2値化する」、以上の4つのOpenCVを使ったプログラムについて学べる記事です。 各コー

    画像処理をやるなら知らないと損!OpenCVがわかる資料まとめ
  • waifu2xでアニメをアップコンバートする - unsuitanの日記

    2015-05-27 waifu2xでアニメをアップコンバートする もう世の中で話題すぎて仕方が無いwaifu2xです(説明はしないので各自ぐぐれ)。 二次元画像を拡大したいと思ったことはありませんか? - デーultraist.hatenablog.com ところでwaifu2xを見て、皆さん思いませんでしたか? waifu2xでSD画質のアニメのアップコンバートしてえ! でもWebアプリだしアニメのアップコンバートなんて…と思ったらGithubでコード公開されてるし、AWSのPublic AMIもあります(北カリフォルニア ami-75f01931)。 自宅でwaifu2xサーバを立てるのもいいですが(その話はまた後日にでも書きますけど)、もうサクッとAWSにg2.2xlargeのスポットインスタンスを立ててしまいましょう。1時間7円くらい、1日170円くらいですよ。 というわけでこの

    waifu2xでアニメをアップコンバートする - unsuitanの日記
  • 二次元画像を拡大したいと思ったことはありませんか? - デー

    うまくできましたか? ボヤけたり、ギザギザになったりしませんでしたか? waifu2xをお試しください。 (ブラウザの処理に影響されないようクリックで拡大おねがいします) waifu2xは、二次元画像を2倍に拡大するソフトウェアです。多くの二次元画像についてスゴイ級のクオリティで拡大できます。 waifu2xは、最新鋭の人工知能技術 Deep Convolutional Neural Networks を使って開発されました。 waifu2xの人工知能は、次の問に答えます。 いまから与える画像はある画像を半分に縮小したものである。縮小される前の画像を求めよ。 画像を拡大するのではなく、縮小される前の状態に戻します。 縮小されてないオリジナル画像を与えた場合も、やはり縮小される前の画像を答えます。 その画像は来存在しないものですが、waifu2xはそれを想像で創ります。 二次元画像のJPE

    二次元画像を拡大したいと思ったことはありませんか? - デー
  • 佐村河内識別システム - ぱろすけ's website

    概要 近年、自称作曲家・佐村河内守氏と外見の酷似した人物が増加し、彼らと佐村河内氏とを自動的に見分けるシステムの開発が望まれている。一方で、佐村河内氏は作曲時と謝罪会見時で大きく外見的に変化することが知られており、佐村河内氏を見分けるシステムはそのような変化に頑健である必要があるため、実現は容易ではない。プロジェクトでは、高度なコンピュータ技術を活用し、佐村河内氏を適切に見分けるシステムを開発する。 背景 自称作曲家・佐村河内守氏が世間を賑わせている。佐村河内守氏が引き起こした様々な問題のうちもっとも厄介なものは、「佐村河内守氏にそっくりな人物が多すぎる」ということである。たとえば、ミュージシャンの Revo 氏は知らない人に「あなたのCDはもう二度と買いません」などと言われるなどの風評被害を訴えており、漫画家のみうらじゅん氏についてもタクシー運転手から「佐村河内さんでしょ?」と執拗に問

    佐村河内識別システム - ぱろすけ's website
  • OpenCVでQRコード認識プログラムを書いてみる(前編) - でぶぬる日記

    プログラマとして仕事をしていて、画像認識プログラムのニーズが最近高まってきている気配が感じられます。 OpenCVを利用した顔認識プログラムは、一部界隈で数年前に流行っていたような気がしたのですが、QRコードを画像認識するような処理はあまりオープンにされているものを見たことがありません。そこでこの機会に思い立ち、トライしてみることにしました。 QRコード認識の為のアルゴリズムは、下記のURLを参考にさせて頂いています。 http://www.adobe.com/jp/devnet/flash/articles/qr_code_reader.html 今回は前編ということで、QRコード認識処理のうち以下までを実装してみました。 画像データをグレースケールに変換 画像データの二値化 画像データのラベリング ラベリングされた矩形からQRコード切り出しシンボルを検出 実はこの段階で画像内でのQRコ

    OpenCVでQRコード認識プログラムを書いてみる(前編) - でぶぬる日記
  • 「理論限界を超える高精細化を実現」、4Kテレビ向け超解像で工学院が新提案

    家庭用テレビの最上位機種として既に4K対応モデルが登場している。しかし現状では4Kの映像コンテンツはほとんど流通していない。そのためハイビジョンの映像信号を拡大し、「超解像技術」を使って画質を高めて表示している。その超解像技術で「従来の理論限界を超える」という新方式を工学院大学の研究グループが開発した。 工学院大学 情報学部情報デザイン学科 合志清一教授の研究グループは、ハイビジョンの映像コンテンツを4Kフォーマットのテレビに出力する際の拡大変換に適用可能で、「従来の理論的限界を超える」(合志教授)という超解像技術を開発し、2012年12月12日、報道機関向け説明会でデモを披露した。 合志教授によれば、旧来の超解像技術は、映像を構成する画像のナイキスト周波数を超える高精細成分は再生できず、それが高精細化の理論的な限界だとされてきた。これに対し工学院大学が提案する独自方式は、簡単な非線形信号

    「理論限界を超える高精細化を実現」、4Kテレビ向け超解像で工学院が新提案
    mikage014
    mikage014 2012/12/19
    音声信号にも適用できたりするのかなぁ
  • 類似画像検索システムを作ろう - 人工知能に関する断創録

    C++版のOpenCVを使ってカラーヒストグラムを用いた類似画像検索を実験してみました。バッチ処理などのスクリプトはPythonを使ってますが、PerlでもRubyでも似たような感じでできます。 指定した画像と類似した画像を検索するシステムは類似画像検索システムと言います。GoogleYahoo!のイメージ検索は、クエリにキーワードを入れてキーワードに関連した画像を検索しますが、類似画像検索ではクエリに画像を与えるのが特徴的です。この分野は、Content-Based Image Retrieval (CBIR)と呼ばれており、最新のサーベイ論文(Datta,2008)を読むと1990年代前半とけっこう昔から研究されてます。 最新の手法では、色、形状、テクスチャ、特徴点などさまざまな特徴量を用いて類似度を判定するそうですが、今回は、もっとも簡単な「色」を用いた類似画像検索を実験してみます

    類似画像検索システムを作ろう - 人工知能に関する断創録
  • miyagawanize2 - ゆーすけべー日記

    はじめに miyagawa(宮川達彦)さんはスーパーギークの一人です。昨日のLL Decadeでも基調講演なさってました。 誰しもmiyagawaさんのようにコードを書きたいと思っているはずです。 しかし、僕たちは彼のようにはなれません。なぜなら「紫色の何か」が欠けているからです。 紫色の何か これは一体なんなんでしょうか?僕には分かりません... けれど、miyagawaさんのようになるには必要なものです。 そこでmiyagawanize2というWebアプリを作ってみました。 miyagawanizeの基 miyagawanizeでは以下のモジュールを使います。 use Imager; use Image::ObjectDetect; ImagerはPerlらしく画像処理をするためのモジュール。 Image::ObjectDetectはOpenCVの物体検出の部分をPerlから利用でき

    miyagawanize2 - ゆーすけべー日記
    mikage014
    mikage014 2012/08/07
    「誰しもmiyagawaさんのようにコードを書きたいと思っているはずです。 しかし、僕たちは彼のようにはなれません。なぜなら「紫色の何か」が欠けているからです。」
  • 本当は速いImageMagick: サムネイル画像生成を10倍速くする方法 - 昼メシ物語

    一般的に ImageMagick のサムネイル画像生成は遅いとされており、パフォーマンスが求められるシーンでは Imlib2 などのより高速な画像処理ライブラリが使われることが多いです。 Imlib2 の高速さについては、以前「Imlib2でImageMagickより3倍高速かつ美しいサムネイル画像の生成 - 床のトルストイ、ゲイとするとのこと」という記事で紹介しました。この記事のベンチマークにおいて、Imlib2 によるサムネイル画像の生成は、 ImageMagick の3倍程高速でした。 しかし、 ImageMagick は Imlib2 より画質がよく、高機能で使いやすく、今も頻繁にメンテナンスされており、とてもよく出来ています。その点 Imlib2 は、2004年からメンテナンスされておらず、セキュリティホールが見つかっても、各Linuxディストリビューションがそれぞれパッチを当て

  • Canvas + File API + Drag&Drop API で Instagram みたいな画像フィルターを作ってみた - hakobera's blog

    Instagram の画像フィルターみたいことを HTML5 (Canvas + File API + Drag&Drop API) で実装してみました。 Instagram みたいなの - jsdo.it - Share JavaScript, HTML5 and CSS 動作するブラウザは FireFox 3.6、Chrome 8 開発版です。(Chrome 7 は File API はサポートしていますが、どうやら iframe 内では動作しないため、上記 jsdo.it 上では動作しません。) できること これを こんな風に加工できます。 大学時代に画像処理の研究をやっていた身としては、ブラウザだけでもここまで出来るようになったのか、と少し感慨深いです。 やっていること Drag&Drop API で画像ファイルを取得 File API で画像ファイルを DATA URI 形式に変

    Canvas + File API + Drag&Drop API で Instagram みたいな画像フィルターを作ってみた - hakobera's blog