Автор Тема: Поиск файлов по тексту в Linux  (Прочитано 2251 раз)

Оффлайн ivm

  • Ветеран
  • *****
  • Сообщений: 1944
Re: Поиск файлов по тексту в Linux
« Ответ #15 : 28 Марта 2018, 19:25:35 »
Я вижу возможность поиска по конкретной папке: для этого нужно проиндексировать каждую папку и создав индексные базы с соответствующими именами. Правда, это через одно место получается. С другой стороны, я проверил работу поисковой машины, работает очень шустро. Если только речь не идёт о террабайтных томах.
Что непонятно спрашиваем, если всё понятно - пользуемся.
Что бы ни случилось, всё будет хорошо!

Оффлайн Кулиш Евгений

  • Старожил
  • ****
  • Сообщений: 338
    • ЖЖ
Re: Поиск файлов по тексту в Linux
« Ответ #16 : 28 Марта 2018, 19:28:16 »
Нашёл инструкцию по инсталляции поиска DocFetcher
https://forums.linuxmint.com/viewtopic.php?t=234643
Только не осилил...
Как её в Матунту установить?
Скачать её можно тут: https://sourceforge.net/projects/docfetcher/files/docfetcher/

Оффлайн Кулиш Евгений

  • Старожил
  • ****
  • Сообщений: 338
    • ЖЖ
Re: Поиск файлов по тексту в Linux
« Ответ #17 : 28 Марта 2018, 19:33:38 »
Если только речь не идёт о террабайтных томах.
Так в том то и дело, что в 40 папках лежат только доки: "30 239 items, totalling 745,2 МБ (803,2 МБ on disk)" только в 3-х форматах: odt, doc docx...
« Последнее редактирование: 28 Марта 2018, 19:37:38 от Кулиш Евгений »

Оффлайн ivm

  • Ветеран
  • *****
  • Сообщений: 1944
Re: Поиск файлов по тексту в Linux
« Ответ #18 : 28 Марта 2018, 21:52:52 »
Нашёл инструкцию по инсталляции поиска DocFetcher
https://forums.linuxmint.com/viewtopic.php?t=234643
Только не осилил...
Как её в Матунту установить?
Скачать её можно тут: https://sourceforge.net/projects/docfetcher/files/docfetcher/
Как я понял, Вы любите плавать с 16-кг гирей на шее. В данном решении нужен будет Java, (но не мотоцикл!), который надо ещё установить. С моей точки зрения, это загадить систему.
Что непонятно спрашиваем, если всё понятно - пользуемся.
Что бы ни случилось, всё будет хорошо!

Оффлайн Кулиш Евгений

  • Старожил
  • ****
  • Сообщений: 338
    • ЖЖ
Re: Поиск файлов по тексту в Linux
« Ответ #19 : 28 Марта 2018, 22:47:17 »
... В данном решении нужен будет Java, (но не мотоцикл!), который надо ещё установить. С моей точки зрения, это загадить систему.
Яву просил и ОпенОффис при попытке поставить языковое дополнение,
Яву просил и банковский плагин для Файрфокса...
Лишние приложения я не люблю, но, видимо, придётся ставить, ведь простого решения для простого поиска пока нет...

Оффлайн Кулиш Евгений

  • Старожил
  • ****
  • Сообщений: 338
    • ЖЖ
Re: Поиск файлов по тексту в Linux
« Ответ #20 : 29 Марта 2018, 00:14:23 »
Вот ещё вариант, но как он работает - не пойму...
https://geoff.greer.fm/ag/
https://github.com/ggreer/the_silver_searcher
« Последнее редактирование: 29 Марта 2018, 00:18:31 от Кулиш Евгений »

Оффлайн alv

  • Ветеран
  • *****
  • Сообщений: 1228
  • Это я и есть
    • Наш Блогосайт
Re: Поиск файлов по тексту в Linux
« Ответ #21 : 29 Марта 2018, 06:07:40 »
простого решения для простого поиска пока нет...
Простого решения для простого поиска по простым офисным документам нет и не пока, а вообще. И не будет. Потому что простого поиска по doc-файлам не может быть никогда вследствие закрытости формата - это всё равно, что искать фрагмент Си-кода в откомпилированном бинарнике.
Для odt или docx, которые есть просто компрессированный XML, теоретически можно сочинить скрипт с использованием zgrep, например. Только очень сомневаюсь , то это будет простое решение...
За прекрасных дам!

Оффлайн Кулиш Евгений

  • Старожил
  • ****
  • Сообщений: 338
    • ЖЖ
Re: Поиск файлов по тексту в Linux
« Ответ #22 : 29 Марта 2018, 12:46:42 »
Под простым решением я понимаю кнопочку, встроенную в файл-менеджер, после нажатия которой открывается поле ввода текста и выбор опций: по названию или по содержимому. Всё. Какая команда при этом начнёт исполняться: grep, find или ack - не важно.

Оффлайн alv

  • Ветеран
  • *****
  • Сообщений: 1228
  • Это я и есть
    • Наш Блогосайт
Re: Поиск файлов по тексту в Linux
« Ответ #23 : 29 Марта 2018, 13:30:44 »
Под простым решением я понимаю кнопочку, встроенную в файл-менеджер, после нажатия которой открывается поле ввода текста и выбор опций: по названию или по содержимому.
Чтобы кнопочка, встроенная в файл-менеджер, позволяла искать по содержимому офисных документов, такую кнопочку кто-то должен сделать. То есть сочинить соответствующий плагин.
Задача эта, как уже говорилось выше, вполне нетривиальная. Насколько я понимаю, её никто не решал. Подозреваю, потому, что те, кто мог бы такой плагин сочинить, в данной функции не нуждаются :)
За прекрасных дам!

Оффлайн Кулиш Евгений

  • Старожил
  • ****
  • Сообщений: 338
    • ЖЖ
Re: Поиск файлов по тексту в Linux
« Ответ #24 : 29 Марта 2018, 21:41:29 »
Нашёл решение, которое внешне - отлично, но только, по неизвестной мне причине, не работает...
catfish
(в синаптике есть)

Оффлайн ivm

  • Ветеран
  • *****
  • Сообщений: 1944
Re: Поиск файлов по тексту в Linux
« Ответ #25 : 29 Марта 2018, 23:29:04 »
Евгений, catfish работает, но Вы хотите искать файл по содержащемуся тексту. Он ищет только то, что может найти. И найти может текст только в простых текстовых файлах. Рекомендованный Вам инструмент Recoll прекрасно справляется с нужными Вам задачами, но Вы почему-то его проигнорировали.
Предлагаю тему считать закрытой.
Что непонятно спрашиваем, если всё понятно - пользуемся.
Что бы ни случилось, всё будет хорошо!

Оффлайн alv

  • Ветеран
  • *****
  • Сообщений: 1228
  • Это я и есть
    • Наш Блогосайт
Re: Поиск файлов по тексту в Linux
« Ответ #26 : 29 Марта 2018, 23:34:39 »
Нашёл решение, которое внешне - отлично, но только, по неизвестной мне причине, не работает...
catfish
catfish прекрасно работает. Только там, для чего он предназначен. А для поиска в офисных документах он не предназначен - всё по той же причине: никто не написал соответствующего бэк-энда.
За прекрасных дам!

Оффлайн vita

  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 3060
  • Да будет свет!
Re: Поиск файлов по тексту в Linux
« Ответ #27 : 30 Марта 2018, 11:54:22 »
Для просмотра файлов формата MS Word средствами Recool в синаптике предлагается установить пакет antiword.
Действительно, без установки пакета antiword в дополнение к Recoll поиск  в офисных документах не будет работать. Задаётся поиск в меню Конфигурация индексирования добавлением любого конкретного каталога, даже на флешке. Перед началом поиска нужно выполнить обновление индекса или переиндексацию.
Проверила в Matuntu-B64-M120 поиск на флешке в заданном каталоге документов, созданных в LO и OO, Найденные по критерию поиска документы нашлись и нормально открываются в OpenOffice прямо со страницы Recoll.
Делай с нами, делай как мы, делай лучше нас!

Оффлайн alv

  • Ветеран
  • *****
  • Сообщений: 1228
  • Это я и есть
    • Наш Блогосайт
Re: Поиск файлов по тексту в Linux
« Ответ #28 : 30 Марта 2018, 13:27:04 »
без установки пакета antiword в дополнение к Recoll поиск  в офисных документах не будет работать.
Была ещё такая программа catdoc, аналог antiword'а. Точнее, наоборот, Витя Вагнер её раньше сочинил. Правда, и забросил раньше.
Но в выводе
apt show recollони обе фигурируют в качестве suggests.
Про catdoc от автора.
« Последнее редактирование: 30 Марта 2018, 13:29:21 от alv »
За прекрасных дам!

Оффлайн ivm

  • Ветеран
  • *****
  • Сообщений: 1944
Re: Поиск файлов по тексту в Linux
« Ответ #29 : 30 Марта 2018, 14:15:52 »
При внимательном рассмотрении RECOLL (в переводе "воспоминания") всё больше и больше нравится. После добавления всех рекомендованных для него пакетов ищет всё.
Вышла одна "незадача". По умолчанию файлы pdf при нахождении в них результата должны открываться в Evince, а в Mate используется Atril. Оказалось, что при правом клике на пункте Предпросмотр в выпавшем меню есть пункт Open With, позволяющий выбрать Atril и GIMP. Аналогично можно выбрать открытие офисных документов в установленном на компьютере офисе. У меня, например, установлены  китайский WPSO и AOO.
Что непонятно спрашиваем, если всё понятно - пользуемся.
Что бы ни случилось, всё будет хорошо!