blog công nghệ

Các vấn đề được tìm thấy bằng cách kiểm tra máy chủ tìm kiếm toàn văn mã nguồn mở Fess và những điều cần xem xét trong phần giới thiệu

Lần này,Máy chủ tìm kiếm toàn văn mã nguồn mở FessTôi muốn giới thiệu về

Hôm nọ, một khách hàng nào đó đã gửi cho chúng tôi một yêu cầu tới trang web cổng thông tin và máy chủ tệp Windows nội bộ của chúng tôiTôi muốn bạn phản hồi để bạn có thể tìm kiếm bằng Fess, đã có một cuộc tư vấn.

Có hai lý do khiến khách hàng lựa chọn sử dụng Fess.

  1. Đối phương cũng có chút kiến thức
  2. Tôi không thể tăng chi phí xây dựng lên nhiều nên tôi muốn xây nó với giá rẻ nhất có thể bằng những thứ hiện có

Vì vậy, tôi quyết định điều tra Fess trước.

logo sanel
Phòng phát triển Sunel
Trong nửa sau, cuộc khảo sát cho thấyCác vấn đề và điều cần lưu ý khi giới thiệuđược tóm tắt.

Fess ngay từ đầu là gì?

Fess là một sản phẩm công cụ tìm kiếm toàn văn miễn phí. Tính năng này là "chức năng tìm kiếm cho người dùng cuối" và "chức năng dành cho quản trị viên như cài đặt" được thiết lập.

Tôi sẽ bỏ qua phần giải thích chi tiết về "tìm kiếm toàn văn". Nếu bạn quan tâm đến,Trang web đàn hồiRất dễ hiểu nên các bạn hãy xem nhé.

ElasticSearch được bao gồm trong Fess,Cũng có thể chỉ định một ElasticSearch bên ngoài.

Nếu bạn có nó bên trong, nó sẽ tiêu tốn rất nhiều bộ nhớ, vì vậy có vẻ như hiện tượng mất phản hồi trong một thời gian với thông số kỹ thuật thấp sẽ xảy ra.Vấn đề này được giải quyết bằng cách sử dụng dịch vụ ElasticSearch SaaS ban đầu.

Tuy nhiên,Nếu bạn sử dụng dịch vụ này, bạn sẽ phải trả phí dịch vụ.

Vì vậy, tôi nghĩ nên cân nhắc nên sử dụng cái nào có tính đến môi trường hoạt động (thông số kỹ thuật).

Ngoài ra, nếu JAVA hoạt động, nó sẽ hoạt động trên mọi hệ điều hành mà không gặp vấn đề gì. Chi tiết là,Trang web chính thức của Fessvui lòng truy cập trang

Ngoài ra, một công ty tên là N2 System đang thương mại hóa nó và cótrang web demoBạn có thể thử tìm kiếm Fess tại

Tìm kiếm linh hoạt

Một công cụ tìm kiếm toàn văn bản mã nguồn mở được phát triển bởi Elastic. Các tài liệu chứa các từ mục tiêu có thể được trích xuất ở tốc độ cao từ một số lượng lớn tài liệu.

Bạn có thể làm gì với Fess?

  • Tìm kiếm dựa trên nhiều nguồn dữ liệu khác nhau
  • Điều kiện tìm kiếm khác nhau
  • Chưc năng quản ly
  • Hỗ trợ các tập tin mục tiêu tìm kiếm khác nhau
  • Chức năng đăng ký từ điển
  • API
  • Mã nguồn mở

Tìm kiếm dựa trên nhiều nguồn dữ liệu khác nhau

Bạn có thể tìm kiếm dựa trên dữ liệu được thu thập bằng cách thu thập dữ liệu từ nhiều nguồn dữ liệu khác nhau.

Cụ thể, trước tiên, bạn có thể thu thập dữ liệu trang web và tìm kiếm trong trang web.

Tiếp theo, bạn có thể tìm kiếm tệp trên máy chủ tệp và thư mục cục bộ cũng như tìm kiếm văn bản trong tệp.

Ngoài ra,Bạn cũng có thể tìm kiếm dựa trên các nguồn dữ liệu như MySQLvì vậyTôi nghĩ nó có nhiều công dụng.

Điều kiện tìm kiếm khác nhau

Các điều kiện tìm kiếm của Fess không chỉ là các điều kiện thông thường như khớp một phần, khớp chính xác, ký tự bị loại trừ,Ngoài ra, bạn có thể tìm kiếm bằng cách chỉ định chi tiết các điều kiện khác nhau.

Cụ thể có các phương pháp tìm kiếm sau.

phương pháp truy xuất nội dung
VÀ tìm kiếm Tìm tài liệu chứa tất cả nhiều cụm từ tìm kiếm của bạn
HOẶC tìm kiếm Tìm tài liệu có chứa bất kỳ cụm từ tìm kiếm nào
KHÔNG tìm kiếm Được sử dụng để tìm các tài liệu không chứa một từ
Tìm kiếm theo nhãn (tìm kiếm danh mục) Bằng cách thêm thông tin nhãn để phân loại tài liệu cần tìm kiếm, thu hẹp tìm kiếm bằng cách chỉ định nhãn tại thời điểm tìm kiếm.
Tìm kiếm theo trường Kết quả thu thập thông tin bằng Fess được lưu cho từng trường như tiêu đề và nội dung. Tìm kiếm bằng cách chỉ định các trường đó
Sắp xếp tìm kiếm Sắp xếp kết quả tìm kiếm bằng cách chỉ định các trường như ngày và giờ tìm kiếm
Tìm kiếm ký tự đại diện Tìm kiếm bằng ký tự đại diện một hoặc nhiều ký tự trong cụm từ tìm kiếm
tìm kiếm phạm vi Nếu một phạm vi có thể được chỉ định, chẳng hạn như một số và dữ liệu được lưu trữ trong một trường thì việc tìm kiếm theo phạm vi được chỉ định sẽ được thực hiện cho trường đó.
Tăng cường tìm kiếm (tìm kiếm có trọng số) Nếu bạn muốn ưu tiên một cụm từ tìm kiếm cụ thể trong số các cụm từ tìm kiếm, hãy tìm kiếm theo mức độ quan trọng của cụm từ tìm kiếm
Tìm kiếm mờ (tìm kiếm mờ) Phương pháp tìm kiếm để tìm kiếm những từ không khớp chính xác với cụm từ tìm kiếm
Tìm kiếm vị trí Bằng cách thêm thông tin vị trí kinh độ và vĩ độ vào mỗi tài liệu khi tạo chỉ mục, có thể tìm kiếm bằng cách sử dụng thông tin vị trí tại thời điểm tìm kiếm.
Tiêu chí tìm kiếm ẩn Sử dụng tham số ex_q khi bạn muốn định tuyến các điều kiện tìm kiếm cụ thể mà không hiển thị chuỗi điều kiện tìm kiếm trên màn hình. Ngay cả khi màn hình chuyển tiếp bằng cách phân trang, các điều kiện vẫn có thể được giữ lại mà không hiển thị các điều kiện trên màn hình.
tìm kiếm vai trò Một phương pháp tìm kiếm có thể được sử dụng bởi người dùng đăng nhập bằng chức năng quản lý người dùng của Fess. Sau khi đăng nhập với tư cách người dùng do Fess quản lý, hãy thay đổi tìm kiếm vai trò và mật khẩu người dùng
Tìm kiếm ký tự đặc biệt Bằng cách thoát các ký tự đặc biệt sau, bạn có thể sử dụng chúng làm ký tự tìm kiếm.
+ - && || ! ( ) { } ^ " ~ * ? : \ /
tìm kiếm chi tiết Tìm kiếm với điều kiện phức tạp hơn từ màn hình tìm kiếm nâng cao

Chưc năng quản ly

Fess có chức năng quản lý và bạn có thể đặt các cài đặt chung như mục tiêu thu thập dữ liệu và chức năng lập lịch.

Cài đặt cụ thể là gìHướng dẫn quản trị trang web chính thức của Fessvề hoa của Mie

Hỗ trợ các tập tin mục tiêu tìm kiếm khác nhau

Hỗ trợ đầy đủ các loại tệp, bao gồm PDF và Microsoft Office Word.

Tệp mục tiêu tìm kiếm Fess

  • văn bản (txt)
  • XML (xml, xhtml, mm, v.v.)
  • HTML (html, htm)
  • MS Office (doc, xls, ppt, docx, xlsx, pptx, v.v.)
  • PDF (pdf, v.v.)
  • Mã nguồn (js, c, h, java, v.v.)
  • Các tệp nén (gz, tar, zip, v.v.)
  • văn bản có định dạng (rtf)
  • ePub
  • Âm thanh/Hình ảnh/Video (trích xuất siêu dữ liệu)
  • mbox
  • ai (tương thích với PDF)

Chức năng đăng ký từ điển

Vì có chức năng đăng ký từ điển, ví dụ: với "sanel" và "sunl"Nếu bạn muốn ánh xạ các danh từ riêng, bạn có thể làm như vậy bằng cách đăng ký từ điển riêng lẻ.

API

Vì có API,Bạn có thể dễ dàng gọi và sử dụng công cụ tìm kiếm từ bên ngoài như hệ thống web.

Tuy nhiên,Vì đây chỉ là loại GET nên không có API loại cập nhật hoặc cài đặt thu thập thông tin nào dành cho quản trị viên.

Đối với thông số kỹ thuật API,Hướng dẫn API trang web chính thức của Fessvui lòng truy cập trang

Mã nguồn mở

Nó là mã nguồn mở nên bạn có thể tự do sửa đổi nó.Bạn có thể bỏ nguồn từ github.

Tuy nhiên,Việc tùy chỉnh đòi hỏi phải có kiến thức nhất định về Fess.

(Tham khảo) Thông số kỹ thuật khuyến nghị khi sử dụng Fess

Dù chưa được công bố chính thức nhưng có vẻ như thông số kỹ thuật khá cần thiết.

Dưới đây chúng tôi sẽ giới thiệu những thông tin về công ty giới thiệu Fess để bạn tham khảo.

(Tham khảo) Thông số kỹ thuật khuyến nghị khi sử dụng Fess

  • CPU 2 lõi (khuyên dùng 4 lõi trở lên)
  • Bộ nhớ 8GB (khuyên dùng 16GB trở lên)
  • Ổ cứng 200GB (khuyên dùng 500GB trở lên tùy dung lượng dữ liệu)

Trích dẫn:https://www.designet.co.jp/ossinfo/fess/support/

Nếu bạn muốn nhanh chóng xác minh cục bộ,DockerNó nhanh chóng.

Hai vấn đề được tìm thấy trong cuộc khảo sát Fess này

Tôi đã thử chạy Fess trên Docker cục bộ dưới dạng dùng thử, nhưng hai điều sau đây dường như có vấn đề.

Vấn đề 1 | Tìm kiếm Powerpoint không xuất hiện

Powerpoint dùng để kiểm traNó được nhận dạng và lập chỉ mục bởi các lần thu thập dữ liệu nhưng việc tìm kiếm văn bản trong tệp không hiển thị trong kết quả tìm kiếm.

Vì PowerPoint được hỗ trợ nên có thể có một số điều kiện nhất định không được truy xuất, điều này cần được điều tra và xác minh.

Vấn đề 2 | Cài đặt điều chỉnh

Ví dụNếu một số lượng lớn tệp được tìm kiếm, máy chủ có thể ngừng hoạt động nếu cài đặt không phù hợp với thông số kỹ thuật của máy chủ.

thực sự là địa phươngKhi tìm kiếm một thư mục có hàng trăm tệp, nó sẽ hết thời gian chờ và treo như cũ.

Những điều cần cân nhắc khi giới thiệu Fess

Khi giới thiệu Fess,Tôi nghĩ sẽ tốt hơn nếu kiểm tra và xem xét ít nhất ba điều sau.

Đầu tiên làHiểu tổng dung lượng của dữ liệu mục tiêu.

Nếu bạn không biết điều này, bạn không thể quyết định dung lượng đĩa cần chuẩn bị. Ngoài ra, mức độ điều chỉnh cài đặt cần thiết sẽ thay đổi.

Tiếp theo, làm rõ các loại dữ liệu và tệp cần tìm kiếm vàTốt hơn là kiểm tra xem nội dung được Fess hỗ trợ có được bảo vệ hay không.

Cuối cùng là môi trường dữ liệu đích.

Ví dụ,Dù là hệ thống web hay bộ lưu trữ, có xác thực như AD (Active Directory) hay khôngNội dung cài đặt thay đổi tùy theo mục tiêu.

[Tóm tắt] Điều tra máy chủ tìm kiếm toàn văn mã nguồn mở Fess

Tôi đã điều tra Fess lần này, nhưng theo ấn tượng, nó có vẻ khá thuận tiện nếu bạn muốn dễ dàng nhập tìm kiếm toàn văn bản cho máy chủ tệp nội bộ và máy chủ web trong môi trường tại chỗ.

Bạn không cần phải tạo GUI.

Tuy nhiên,Không phù hợp lắm nếu bạn phải tùy chỉnh màn hình một cách chi tiếtTôi cảm thấy như

Tất nhiên, nó là nguồn mở nên có thể tùy chỉnh, nhưng cuối cùng, tôi không nghĩ đó là một ý tưởng hay vì nó đòi hỏi chi phí bảo trì, chẳng hạn như cách xử lý các bản cập nhật.

logo sanel
Phòng phát triển Sunel
Chúng tôi sẽ tiếp tục giới thiệu nhiều công cụ và dịch vụ CNTT khác nhau trên thế giới, vì vậy hãy chờ đợi nhé.

Remy - thân trên sang một bên
“MieL” được ra mắt với mong muốn hình dung “sự kết nối” giữa khu vực, các công ty và người dân tỉnh Mie. Chúng tôi cung cấp nhiều nội dung hữu ích cho kinh doanh và cuộc sống, chẳng hạn như thông tin về người sành ăn và cửa hàng trong tỉnh, hoạt động của Sun-El và công nghệ kỹ thuật số.
*Được quản lý tại thành phố Matsuzaka, tỉnh Mie Công ty TNHH Sun-El đang làm

-blog công nghệ
-, ,

viVietnamese

© 2024 MieL