画像変換Night / 2015-02-18
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。システム統括本部 データソリューション本部の宮崎です。 最近ディープラーニングと呼ばれる技術の話題を耳にすることが増えてきました。 この記事ではディープラーニングの手法を実装し画像認識系の用途で便利に使えるCaffeというツールの使い方を紹介します。 Caffeの概要 Caffeは、C++で実装されGPUに対応した高速なディープラーニングのライブラリです。 大規模画像認識のコンテストILSVRCで2012年にトップとなった畳込みニューラルネットワークの画像分類モデル[1]がすぐに利用できるようになっています。 Caffeは、カリフォルニア大学バークレー校のコンピュータビジョンおよび機械学習に関する研究センターであるBV
自動タギングを可能にする高度な画像認識のWebサービスAPI『ReKognition』 『ReKognition API』は指定画像の内容を認識/判断し、その画像が何であるかを自動検出するテクノロジーを用いた統合的なWebサービスAPI。 PHP, iOS, Androidなど各種SKDとしても提供されており様々なプロジェクトやアプリ開発で利用することができます。 先ずはデモが用意されているのでそちらを見てもらうと分りますが、画像認識のタイプとしては大まかに画像の内容物を検出する「オブジェクト認識」と人間の顔を検出する「顔認識」の2種類があります。 「オブジェクト認識」はその画像内に含まれる物体や背景を認識して、それに該当する可能性の高いキーワードを列挙していきます。 一方、「顔認識」の方は単に顔の検出だけでなく、顔の各パーツを検知して性別や年齢あるいは表情から読み取れる感情までも検出する
At Lyst we process a lot of products from a lot of retailers. However, the product information we get from retailers isn’t the same across the industry as: Retailers may categorise products differently to competitors, Retailers may not provide every bit of information that we need, Retailers may have large catalogues and use vague auto-generated descriptions. Due to this, we have to ensure that ea
The document describes TOFU (Tofu on the Fly), a system for dynamically generating and caching image thumbnails on Amazon S3. It works by installing an Apache module that generates thumbnails using ImageMagick when images are requested, then caches them on S3 for future requests. This avoids hitting application servers for every image and provides scalability. The document discusses the TOFU archi
S3に配置した画像をURLから指定したサイズにリサイズできるリアルタイムリサイズサーバをnodeで書いた。 Featuresスケーラブルでハイパフォーマンス。導入はとっても簡単。複数のバケットが使える。賢いキャッシュ。(ファイルサイズと更新日から304を返す)Architecture1台構成 +---------+ +------------+ +------------+ +----+ | Browser | <--> | CloudFront | <--> | EC2 (hose) | <--> | S3 | +---------+ +------------+ +------------+ +----+スケールアウト +------------+ | EC2 (hose) | +---------+ +------------+ +-----+ +------------+ +---
http://instagram-engineering.tumblr.com/post/12651721845/instagram-engineering-challenge-the-unshredder 以上のようにバラバラに切断された画象を以下のように戻せ、という問題。 画象の分割数は予め与えられれているものとする。(自動的に画象の分割数を求めるとボーナス得点有り) とりあえず隣接するカラムの類似度(画素間の距離)を行単位で求め、類似度が高いものから順に並べていけばいいんじゃないかと考えた。 画素間の距離をRGBで求めるとうまく行かなかったけど、HSVで求めるとうまく行った。ふむ。 # -- coding utf-8 -- from PIL import Image, ImageChops, ImageStat import math, operator, sys, colorsys
OptiPNGが0.7にバージョンアップして、待望のメタデータを削除する機能がついた。これでpngcrushいらなくなるかも。0.7では他にlibpngの脆弱性についての対応もなされているので、使用している人は更新するべき。 オプション名は-stripで、それに続けて削除したいチャンク名を指定する……ということになっているが、今のところはallというキーワードでの全削除しかできないようで、これとこれだけ削除とかはできない。 $ optipng -strip all test.png ざっと試した所、pHYs (アスペクト比やDPI)やiCCP(カラープロフィール)、cHRM(ホワイトバランス)あたりは削除されたので、オプションから想像できる通り必須チャンクとtRNS以外を削除するんじゃないかと思う。つまりpngcrushで言うところの-rem allb相当な感じなので、これをメインに使って
はじめに こんにちは、クラスメソッド株式会社でWebを担当している野中です。前回はWebサイトの高速化を行うにあたり知っておきたい「HTTPの仕組み」について紹介しました。 HTTPの仕組みについて何となく理解できたでしょうか? この連載で紹介していく高速化テクニックの解説を理解するために必要ですので、都合の良い時に読んでおいてください。 「いつ読むか? 今でしょ!」なんてね(笑) もう古いですね。 対象者 この記事では、特にWebデザイナーを対象としています。 フロントエンドエンジニアの方はWebデザイナーから受け取ったPSD(Adobe Photoshop Data)ファイルや、AI(Adobe Illustrator Data)ファイルから画像を書き出すこともあると思うので、その際の参考にしてください。 Webデザイナー フロントエンドエンジニア Webディレクター Web担当者 ビ
Python Imaging Libraryの関数を使いながらのメモです。 テスト用のモジュールTestPIL.pyを作成し、同じディレクトリに全て同じサイズの適当なRGB画像"test.bmp","test2.bmp","mask.bmp"を用意して実行してみました。以下使えそうな関数をひたすらピックアップ&リストアップ。関数の書き方は、変数名:型、関数名(引数名:引数型):返却値型という表記を使うことにします。 モジュールのインポート from PIL import Image Imageクラスのメンバ変数 format:string 画像ファイルのフォーマット mode:string 階調。"1":2値画像,"L":グレースケール,"RGB","CMYK"など size:turple (width, height) 画像サイズ pallete:palette 画像モードが"P"のとき
Perlから(も)使える静止画を対象としたアニメ顔検出ライブラリです。※Ruby版もできました。 ここは主に技術的な内容について紹介するページになっています。 ライブラリの使い方や機能の紹介は Perlでアニメ顔を検出&解析するImager::AnimeFaceにあります。この記事は僕自身が書いてます。 (画像はヤスヒロさん撮影の写真) もくじ アニメ顔検出とは? Imager::AnimeFaceとは? より詳しい説明 デモ ダウンロードとインストール アニメ顔検出とは? アニメ顔検出とは、無作為に提示されたひとつの画像データの中に存在する全てのアニメ顔の位置を見つけることです。多様なアニメ顔をひとつの顔クラスとし、画像上のさまざまな領域について『顔』と『顔以外』に正確かつ高速に分類する問題になります。 多くの場合、1枚の画像には0~20個程度の顔しか存在していません。これに対して顔以外
まだgithubにはpushしていないのですが、さいきょうの組み込み型画像検索エンジンotamaに計量学習を用いて与えられたデータにあった画像間の距離関数を学習してそれを使って検索するというドライバを入れたので、先行的なデモとしてアニメ顔類似検索v3を作ってみました。 計量学習は、ベクトル間の距離の計り方を機械学習で決めるみたいな分野です。 アニメ顔類似検索v3 AnimeFace Search v3 - Otama LMCA_VLAD_HSV Driver randomボタンを押すと顔画像がランダムに出るのでどれかクリックするとそれをクエリに検索します。color weightは色の重みを調節するパラメーターで、1にすると色だけで検索します。0にすると形状やテクスチャだけで検索します。結果画像の上の数字は類似度的なもので、その横のgglは元画像をGoogle Search by Imag
Python Imaging LibraryのImageクラスのデータをNumpyのarrayとして扱うための方法について。 Numpyの関数を使って直接pixel値を書き換えることが目標です。 まずは両方のライブラリをインポートしておきます。 import numpy import Image PILからNumpyのarrayへの変換 numpyで用意されているasarray関数を使うと、PILのImageオブジェクトを配列に変換することができます。 imgArray = numpy.asarray(pilImg) さらに配列の値を書き変えられるようにするためには、writeableフラグをTrueにする必要があるようです。 imgArray.flags.writeable = True NumpyのarrayからPILへの変換 PILのfromarrayメソッドによって、配列の各値を1
The VLFeat open source library implements popular computer vision algorithms specializing in image understanding and local features extraction and matching. Algorithms include Fisher Vector, VLAD, SIFT, MSER, k-means, hierarchical k-means, agglomerative information bottleneck, SLIC superpixels, quick shift superpixels, large scale SVM training, and many others. It is written in C for efficiency an
以下のような機能を実装したい。 カメラを自作するのではなく、標準のカメラアプリで画像を撮影する。 撮影した画像はSDカードに保存する。 他の文字列などのデータとともに撮影した画像をPOSTでサーバーに送信する。 サーバー側の負荷やパフォーマンスを考慮し、画像を縮小して送信する。 0. 前提 ターゲット:2.2以上 1. SDカードが挿入されているか確認する // PictureUtil.java public static boolean isSdCardWritable { String state = Environment.getExternalStorageState(); return state.equals(Environment.MEDIA_MOUNTED); } SDカードに保存したいため、外部ストレージの状態を確認するメソッドをユーティリティクラスに定義する。 以下でも
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く