タグ

2024年2月24日のブックマーク (3件)

  • google検索の劣化して専門家はdiscordに行ってしまいインターネットには屑情報だけになってしまった - orangestar2

    またはてないじりの漫画描いてごめんなさい…。でも思いついたら描かないでいられなかったのと、あと、自分が描かなかったらだれが描くんだろう、だれが人力検索はてなのことを思い出すんだろうと思って……。 q.hatena.ne.jp 人力検索はてな www.gizmodo.jp この記事にある通り、最近はさらにひどくなってる。生成AIによって記事の作成が容易になってるのもあるんじゃないかな。よくわかんないけど。 goldhead.hatenablog.com また、このエントリには全面同意で、当に個人の記事にたどり着かなくなった。それに伴い、特殊な事例の処置の仕方(昔は大抵個人がメモっていて、そういうのがヒットした)も全然わからなくなった。野生の専門家がまとめた特定の分野に詳しいホームページが2000年ごろは結構あったんだけれども、そういうものも一切ヒットしなくなった。まず、そういう静的にまとめ

    google検索の劣化して専門家はdiscordに行ってしまいインターネットには屑情報だけになってしまった - orangestar2
    mythm
    mythm 2024/02/24
  • pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama

    これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。 参考記事 導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。 解析コード: from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード: for structure in pdf_elements: print(structure) 結果: 残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ

    pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama
  • 猫ノ沢事件 - Wikipedia

    このページは著作権侵害のおそれが指摘されており、事実関係の調査が依頼されています。 このページの現在または過去の版は、ウェブサイトや書籍などの著作物からの無断転載を含んでいるおそれが指摘されています。もしあなたが転載元などをご存知なら、どうぞこのページのノートまでご一報ください。 著作権侵害が確認されると、このページは削除の方針により一部の版または全体が削除されます。もしこのページの加筆や二次利用をお考えでしたら、この点を十分にご認識ください。 ノ沢事件(ねこのさわじけん)とは、1916年(大正5年)に秋田県河辺郡船岡村船岡字ノ沢(現大仙市協和船岡沢内)で発生した事件である。この事件により全国一の密造酒摘発地であった秋田県での密造酒の習慣を大きく変えるきっかけになった事件であった。「ノ沢」の地名は資料によっては「の沢」と記述される場合も多いが、この記事では前者で統一する。 沢内白山