「全文検索」を含む日記 RSS

はてなキーワード: 全文検索とは

2024-12-23

青空文庫全文検索使えないと不便よなあ、いつ直るんじゃ

2024-10-10

検索汚染なんかより検索対象が消えていくほうがよっぽど重大な問題だろ

いかがでしたかブログしか出てこない」とか言っているのは探し方が悪いだけだ。

そんなことより検索対象が消えていくほうが遥かに重大な問題だ。

ホームページサービスブログサービスが終了するたびに膨大な情報が消えていく。

それらはもう永遠に返ってこないのである

たとえば江戸時代に書かれた大量の日記が目の前で焼かれていたら、学者たちは身を挺してでも必死に炎を消そうとするだろう。

まさに同じことが、いまこの現代で起きているのに、なぜ政府は手を拱いているのか。

大規模なウェブサービスが終了するときはそのデータべースを国会図書館に納めるように法律義務付けよ。

そして国会図書館はそれをデジタルコレクションのように全文検索できる資料として公開せよ。

2024-09-26

増田全文検索

上のちっちゃな検索窓の検索結果、前は耐え難いほど遅くて使う気にならなかったのに、今はすごい速くなってる。

一体いつからだったの?この変更。

2024-08-07

anond:20240807155417

最近官能小説ならBOOK WALKERの横断検索だな。

電子化されてるなら購入してない書籍でも全文検索できる。

しか検索できたとしても実際の文章は「パンティの中はお祭り騒ぎ」ではないかもしれないからな。

記憶違いで本当は「下着の内側はどんちゃん騒ぎ」かもしれない。なかなか難しいんだよな。

ちなみに検索してみたら「子宮の中はお祭り騒ぎ」という一文がヒットした。

これかもしれんね。

https://bsearch.bookwalker.jp/search?word=%22%E5%AD%90%E5%AE%AE%E3%81%AE%E4%B8%AD%E3%81%AF%E3%81%8A%E7%A5%AD%E3%82%8A%E9%A8%92%E3%81%8E%22

お、Googleブックスでは本文まで読める。

https://books.google.co.jp/books?id=eOPNBQAAQBAJ&pg=PT153&dq=%22%E5%AD%90%E5%AE%AE%E3%81%AE%E4%B8%AD%E3%81%AF%E3%81%8A%E7%A5%AD%E3%82%8A%E9%A8%92%E3%81%8E%22

本ってどうやって探せばいいんだい

パンティの中はお祭り騒ぎって文に笑って鬱から救われました。って人のを見てその官能小説探して見たい。が探し方がわかんねえや

国会図書館でもいけば全文検索できるんだろうか。

2024-07-03

これ半分犯罪だろ

ちなみにリアルタイムで今恒心教の掲示板で行われていること

ハッカー公開ファイルダウンロードと分割再配布

ダウンロード効率化のスクリプト作成

・手分けしてハセカラフミリーの情報総当たり

・唐澤貴洋の新口座が発掘される

・唐澤を名乗り「あなたメールアドレス流出情報に含まれていました、うちの口座に3万振り込めばダークウェブからの削除を行います」という趣旨メール文を準備

上記文が出来た直後にちょうど脆弱企業メーラーを1つ乗っ取り成功、角川が漏らしたメアドを一気にインポートさせて順次送信中(Xで23時半頃から続々と着信報告)

データ暫定的ダウンロードし終わり、23時過ぎにTorrentGithubに流した模様

嫌儲に貼られた夏野一家などの個人情報がいっぱい書かれたレスコピペ元は恒心教の掲示板

経営者一家宅に送るピザパイナップルトッピングするかで大激論

掲示板教徒発言

自分メアド過去のものも全部含めて流出してないかかめいから、バラ撒かれたファイル落として確かめる。全文検索かけるのめんどいなあ… せや!ハッキングした企業メーラー適当尊師名義のメール一斉送信させて、自分の端末にヒットするか見るわ!

2024-06-06

生成AIは生成するために使ってくれ

生成AIバブルだけど、大半の要望は「ファイル検索」なんよ

「生成AIならファイルの中身を学習して回答してくれるんでしょ?」

って99%の担当者が言ってくる

かにそういう使い方はできるけど、そもそも全文検索でできるから

文章を生成しなくても

「このファイルのここに書いてありますよ」

って教えてあげるだけで問題解決するから

それで解決しない課題解決しない理由がどこかにちゃんとあるはずなのでそれを洗い出してください

まぁ大抵は「文章化されていない」「制度が整備されていない」のどっちかだけどな

2024-06-02

anond:20240601112828

青空文庫全文検索で出てくる使用例は全部、水属性だな。

昔とは意味が変わったというのはありそうだ。

2024-05-18

https://anond.hatelabo.jp/20240518025458

 Google 検索は、検索漏れがしばしば発生したので、検索漏れに対しては、「登録しまから、その URL を報告してください」というページが用意されていた。しかし今は、そのページがなくなって、検索漏れの報告の受付をしなくなった。

 

 かわりに、サイトの持主ならば、あらかじめサイト登録しておくことで、検索漏れを報告する特別なページが使える。ただし、あらかじめサイト登録しておくことが必要なので、手軽に報告することはできない。

 また、いちいち(数分間をかけて)検索漏れ検証する必要があるので、多くのページを次々と報告することもできない。

 

 結果的に、検索漏れのページがたくさん発生したまま、報告を受け付けないので、検索漏れのページがたくさん残っている。検索漏れのページは、昔はほとんどなかったのに、今ではたくさん発生するようになった。そのせいで、ブログを書いたあとで、サイト検索をしても、Google では検索漏れが多大に発生するようになった。仕方がないので、ブログ機能全文検索するしかない。これだと、サーバー機能が弱いので、瞬時に結果が出ることはなく、かなり待たされるが、検索漏れがないので、Google よりは信頼できる。しかし、遅いんだよね。

 

 

地方公務員からデジタル庁へのおねがい

厚生労働省は通知関係データベース全文検索できるようにしていて国の役所の中では比較的ましな方なんだけど、

こんなふうに重要通知をスキャンデータ掲載してるだけのケースも山ほどあるんよ。なんとかしてくれよ

https://www.mhlw.go.jp/web/t_doc?dataId=00tc1901&dataType=1&pageNo=1

一応市町村向けの専用ポータルみたいのはあってpdfで取得出来たりはするけど、改正の新旧対照表だけのっけて

改正を反映した溶け込み後の通知や条文がついてないとかザラなんよ。頼むよ。

おまえのパソコン一太郎ファイルをそのまま載せればええんよ。

あと保育関係な。通知の名称検索するとGoogleさんがpdfファイルへの直リンを示してくれるけど、

おおもとのhtmlでのページが見つからないもんだから、そのpdf時系列的に最新なのかわからないのよ。

こども家庭庁への無理な移行で重要通知は引き続き内閣府サーバにあるし検索性最悪だしなんとかしれくれ。

2024-05-07

anond:20230609180256

最近は以前ほど流行らなくなった感もあるが、こういったツールを用いて全てを一箇所に記録、蓄積して知的生産に役立てようというのは自分の中でも大きなテーマになっている。

メモツールの類にドキュメントを片っ端から放り込んで全文検索するのが基本的な使い方だ。

近頃はペンダント等のウェアラブルデバイスで常時録音録画して、音声や画像から文字起こしテキスト抽出し記録して検索対象とするサービスが出てきた。

極端な話、もし出生した時からこうしたデバイスを常時着用し、見聞きしたあらゆる事をデータ化できれば、その人生のすべてが検索可能になるだろう。

今後、脳と機械BMI接続できるようになれば、脳内記憶あるいは思考すら外部にデータとして蓄積可能になるかも知れない。

そうなれば、ある意味自分分身デジタル世界に創り出されるとも言える。生きているうちに自分デジタル化するのが今の願望だ。

2024-04-15

デジタル化が進んだおかげで人権を手に入れられている

デジタル化したせいで余計な作業が増えているという記事を読んだ。

https://blog.tinect.jp/?p=86085

自分80年代まれオッサン記事の著者よりも年配なのだが、これっぽっちも共感できなかった。と言うのも社会デジタル化が進んだ時代でなければ、まともな生活を送れていなかったであろうと断言出来るくらいデジタル技術に助けられているからだ。

子供の頃より発達障害の気があったのか、とにかく紙を使った事務作業的なことができなかった。手書き文字が汚すぎて第三者が読めない、学校で配布されるプリント類はまともに整理できないわ、授業の板書はただの走り書きになって見返しても意味不明になるわと、とにかく書類が扱えなかった。手帳を買ってもまともに記録できなくて予定管理ダメダメだった。

そんなわけで、高校までの授業態度を加味した学校の成績は壊滅的だったが、勉強自体はそこそこできたので大学進学はできた。大学生になると授業のレポート作成PCを使えるようになって生活が一変した。壊滅的だと思っていた事務能力が、PCのおかげで飛躍的に向上したのだ。

まず、まともに資料が作れるようになった。手書きノートと違って、誰でも美しい文字がかけて何度でも修正が効く。メモ帳テキスト形式文章を作っておけば、後から内容を検索して見返すことができる。PCのおかげで高校生まで苦手意識のあった資料作成が得意分野に変わったのだ。

次にデータ管理PC検索機能ソート機能には本当に助けられた。ファイル整理を一切しなくても、全文検索拡張子別に並べて日付ソートすれば目当ての資料が見つかるというのは最高すぎた。紙だとそうはいかないので大変だった。

自分場合

必要書類が見つからなくて棚をひっくり返す

数ヶ月後に別の書類必要になった時、前回の捜索でひっくり返したせいで資料がぐちゃぐちゃになって見つからさらにひっくり返して探しまくる

その次、別の書類必要となった時にはさらに棚が混沌としておりもはや発見困難…

というような悪循環を繰り返していたので、デジタル化によってようやくまともに資料管理ができるようになったのだ。

就職活動ときデジタル化に助けられた。そもそも手帳が使えない人だったので、PCからでも携帯からでも入力できるGoogleカレンダーがなければスケジュール管理不可能だった。履歴書だって手書きで作ると字が汚すぎて門前払い喰らっていたかもしれない。

学生の時点でこうなので、就職してからはなおさらである。紙ベース仕事する職場だったら、入社直後に社会不適合者のレッテルを貼られてしまい、干されてパワハラ受けて鬱で退職していたかもしれない。今の職場で15年以上働き続けて、いつしか管理職になり、今では部下を持ってそこそこ仕事が出来ているのはデジタル化のおかげとしか言いようがない。

仮に自分昭和平成初期に社外人になっていたかと思うとゾッとするので、デジタル化が進んだ時代に生きることができて本当に良かったと思っている。そんなわけで、この手の社会デジタル化の議論をする時は、効率の面だけでなくて発達障害の気のある人の救済になっているという側面についても、もう少し注目されても良いのではないかと思う。

2024-04-02

増田の新あいまい検索挙動が興味深い

増田の新全文検索

ひらがなカタカナ両方引っ掛けてくれたり

漢字をひらがな表記にしても引っ掛けてくれたり して賢いんだけど

同音の別の漢字もひっかける のは不便な時の方が多そうに感じた

それはさておき、これ実現するの結構めんどくない?簡単にできるライブラリとかあるの?

2024-04-01

増田検索改善は残念

エイプリルフールネタビッグ検索はともかく全文検索機能改善については、これはこれで簡単検索できることで対立の場としての扱いが加速されるんだろうな

過去増田を発掘しまくる人も出てくるだろうし昔乱暴に書き捨てた記事とか早いとこ消した方がいいし、空白エントリをアップしてしばらくした後で増田でも表に出しにくいこと書いてネットに放流するといったことも気分的にやりにくくなった

俺にとっては増田Googleドメイン検索検索するくらいの手間がちょうど良かった

2024-03-15

anond:20240315160716

前よりマシになったのは確かだけど

全文検索がCJKのこと考えてなくて4文字以上の単語しかインデックスしないとか、word wrapの問題とか、中華フォントとか

西洋人が思いつかない落とし穴はまだまだいっぱいあるよ

2024-02-03

anond:20240203225636

青空文庫全文検索結果

https://myokoym.net/aozorasearch/search?word=%E8%86%82%E5%8A%9B

「可笑しいことに、子路の誇る武芸や膂力においてさえ孔子の方が上なのである。ただそれを平生用いないだけのことだ」(中島敦弟子」)

などの使用例があるそうです

2024-01-24

脳に負担をかける方法

方言禁止話題になって増田もぜんぜん歴史のこと知らなかったんだけどさ、一瞥して企画意図はわかった、というか、正解かわからないけど増田脳内経験においてそういうことだろうってイメージはわいたよね。

いわゆる英語/カタカナ禁止ゲームみたいなやつの一種だなこれ。って。逆ルー語っつーのかな。

そういう普段の出力に一回変換をかませて言いよどんだりウッカリ変換できなかったりを笑う、人間性を笑うというと言葉が悪いけど、人間ならではの労働の苦しみと創造性を楽しむ笑い。

増田関西人だけど関西弁禁止で話してっていわれても不快感はないしぼろぼろ失敗して笑われて自分でも笑うだろうなって思う。

からなんだ、こんなもんに沖縄だけ特別視すんなよとか(他地方版では好評らしいし?)、実際今を生きる沖縄人の若者がこの企画文脈独自に読み取ってどれだけ憤るかってのはすごーく疑問に思ったりする。

  

まあこんな雑な感想はどうでもいいんだが。

それでまあこういう企画ってやっぱ面白いよねって。何が面白いってさっきも書いたけどユニーク表現もあるけどメインはやっぱり人の焦りとか苦悩とか失敗な部分なわけじゃないですか。それを起こすってのは一言で言って「脳に負荷をかける」。

じゃあほかにどんな脳に負荷かけての回答を楽しむ方法があるのかなーって気になるのよね。

 

第一は今回問題になった方言ルー語といった変換系。変換対象を見つける能力と適切に変換する能力必要で、脳に全文検索を強いるから難しいと思う。

次はー、時間制限王道王道だよね。タイムリミットギリギリでの焦りから珍回答を連発する姿が滑稽で面白いタイムショック(古すぎだ)とかネプリーグとか。

ネプリーグタイムボンバー時間制限もだけど、チーム戦で後半になるほど有効回答が減っていくという使えるものが減っていく点もちょっとだけ似たような構図になるのかな?幽遊白書の使える言葉が減っていくゲームとかもこれで考えて喋らないといけない。

脳を働かせないとでいうと酸欠系はあるだろうか?激しい運動を伴うやつ。フレンドパーク(これも通じないだろうな)のルームランナーで走りながら答えるやつって走る人と答える人別々だったっけ?忘れたけど走りながら答えるなら大変だよね。ほかに具体例は思いつかないけど若手芸人が早いもの勝ちのビーチフラッグみたいに回答権を競うやつはありそう。はあはあ言いながら瞬発力で答えるのは大変で笑いになるはず。

もっとシンプルに「脳を働かせない」なら簡単だ。飲酒。これに勝るものなし。芸能人はぁ、あんまりしなかったりする?ドッキリ・隠し撮り系とか?あまり見ないからわからないけど、テレビ飲酒した素人との会話が笑いになってるといえば月曜から夜更かしだろうか。かなりメイン企画になってたと思う。ネットではもう「飲酒実況」とか古くからの笑えるコンテンツだね。

あー酸欠系に似た感じだと欲求疲労系みたいなものもありそう。たとえばまたネットで言うと「耐久配信」みたいな長時間やったり眠らなかったり。これは増田は見たこと無いんだけど。後半は面白いのだろうか?テレビだと帰れま10?食欲を満たす方向と長時間拘束の疲労がウケてたのだろうか。ガキつかの24時間の寝る前や終了前はかなりぐだぐだになるよね。いや書いてて思うけど喋りは面白くないなこれ。疲労系は単純に出てくる量も質も悪くなってその状態左団扇で見て楽しむもうちょっとハイコンテクストな笑いだわ。

 

こんなもんかな?増田、あまりバラエティは見るほうじゃないから思ったほどでなかったわ。あとはー…危険球でいうと、どんな話題でも「与党がー」みたいにこじつけてくる人は脳死で書いてる~みたいに言われてこれも「脳が働いてない笑い」になるのだろうか?おおあぶないあぶない。

TSや男女入れ代わりは女性文化模倣しきれない男性を楽しむコンテンツスカートで股開いたり?いやーやりすぎると無能低能力を嗤うに繋がりそうでダメだね。あくま一時的にってのが大事だと思う。

2024-01-23

anond:20240123122345

オレはraindrop.ioに移行した

無料でもはてブ上位互換だし

年5000円出せばブクマしたページの全文検索記事保存機能がついてお手軽ウェブアーカイブになる

2023-11-02

X(Twitter)を出会い系にするのは日本法律ではほぼ無理

このまとめを読んで、確かにこのままいくのはマズいと感じたので、思ってることを一応自分もまとめておきたい。

イーロン・マスクがXを「出会い系アプリにする」とか言い出したけどXをやめたい→でも、こんな理由があるのでXをやめるのは簡単ではない

https://togetter.com/li/2250441



■■ イーロンマスクへの提言

X(Twitter) の出会い系化をやめるべき。

さもなければ日本人日本企業は X(Twitter) を利用することが事実上できなくなる。

■■ そもそも日本における出会い系サイト定義

面識のない異性と交際したい人=「異性交希望者」といい、交際したい書き込み=「誘引情報」という。

  1. 誘引情報掲載し、
  2. 誘引情報閲覧でき、
  3. 異性同士で相互に連絡をとれる仕組みがあり、
  4. それをサービスとして提供すること。

という「出会い系サイトの4要件」というのがあり、これに当てはまると出会い系サイトということになる。

■■ じゃあ X(Twitter) はどうか
  1. 誘引情報掲載(=現状できちゃってる)
  2. 誘引情報閲覧(=現状できちゃってる)
  3. 異性同士で相互に連絡をとれる仕組み(=DMがある)
  4. それをサービスとして提供する(=現状はしてない)

→ これにより X(Twitter) は、日本法でもマジで出会い系サイトに該当することになりそうだが

→ 現行の法制では恐らくならない。

→ なぜなら X(Twitter) は異性交際だけでなく同性交際もできる仕組みなので、出会い系サイトではないと言い張れるのである

まとめると、 X(Twitter) は本来ギリギリ出会い系サイト扱いされずに済んでたサービスなのだが、「出会い系サイトにする」と明言されてしまうと、それは出会い系サイトになる可能性が高まるである

インターネット異性紹介事業」の定義に関するガイドライン

https://www.npa.go.jp/policy_area/no_cp/uploads/01.pdf



■■ 万が一 X(Twitter) が出会い系サイトに当てはまるとどうなるか

出会い系サイト規制法(インターネット異性紹介事業を利用して児童誘引する行為規制等に関する法律)の規制がある。

  1. 18 歳未満を相手にする誘引情報掲載してはいけない。すぐ削除&退会しないといけない。
  2. 18 歳未満に誘引情報閲覧させてはいけない。すぐ削除&退会させないといけない。
  3. 18 歳未満と相互に連絡できてはいけない。すぐ削除&退会させないといけない。
  4. 18 歳未満にサービス提供してはいけない。年齢確認しないといけない。

まり 18 歳未満がサービスに絡むことを徹底的に排除監視する義務を負うのである

守らないと違法

JC/JK が X(Twitter) 上で「私 JC だけど新宿でこれから即ホ苺」みたいな書き込み放置した瞬間にアウトになり、警察サービス中止命令ができる。

インターネット異性紹介事業を利用して児童誘引する行為規制等に関する法律等の解釈基準

https://www.npa.go.jp/laws/notification/seian/shounen/shounen230705.pdf

インターネット異性紹介事業者の閲覧防止措置義務(いわゆる削除義務)に関するガイドライン

https://www.npa.go.jp/policy_area/no_cp/uploads/02.pdf

もちろん「成人指定とか18禁とかと同じアダルトサイトという括りになるため、教育現場で X(Twitter) を使用することが出来なくなるであろう。コンプラ意識する法人も 18 禁サイトは非常に使いにくくなる。出会い系サイトを名乗るということは、そういうことなである

■■ 利用者の年齢をどうやって確認するか

年齢確認で使っていい手段はいくつかあるが、

  1. 公的身分証あるいは書類を提出させて年齢を確認
  2. クレジットカード支払いなど18歳未満が利用できない手段を使って、何らかの利用料を支払わせる
  3. 携帯キャリア民間の年齢確認サービスなどと API 連携するなりして年齢を確認

これを乗り越えた人しか X(Twitter) を利用することができなくなってしまう。この時点で相当数の離脱者が出てくる可能性が大。

■■ ・・・今でも充分「出会い系」として機能してるんじゃね?

ほんとにそう。昨今の未成年淫行なんてほとんど X(Twitter) やインスタの DM がキッカケになってると思う。警察も X(Twitter) のタイムラインを熱心にパトロールするようになったが、防ぎきれていない。なので SNS警察が今までやってきた青少年保護育成に対する障壁になっているのである

実は出会い系サイトで「未成年淫行」が問題になることはほぼ無い。出会い系サイト運営側はかなりしつこく未成年排除している。そのためなら全文検索するし AI活用するし目視でも確認する。ところが X(Twitter) にはそれがない。未成年が守られていないサービスはむしろ SNS のほう」であることを認識すべきである

■■ 今後 X(Twitter) が出会い系扱いされないようにするための提言

課金者以外は出会い系機能を使えないようにするなど、徹底したゾーニングを行って欲しい。

あるいは DM 機能を年齢確認必須にするか、課金者専用にするなどが良いのではないだろうか。

2023-09-21

anond:20230921161731

全文検索にはお金がかかるのだ

ロクに広告も見てくれない増田にそんなお金をかける理由はない

ログイン ユーザー登録
ようこそ ゲスト さん