大数跨境
0
0

自己配置大模型的搜索引擎SearXNG

自己配置大模型的搜索引擎SearXNG Dr.X的基因空间
2025-07-16
0
导读:3,SearXNG的配置1,安装docker官网:https://www.docker.com/下载最新版的

3,SearXNG的配置

1,安装docker

官网:https://www.docker.com/

下载最新版的,AMD版本的。

image-20250516133906271

设置一个docker_data的存放路径,如:E:/Docker/docker_data/searxng

2,拉SearXNG的镜像

直接在docker的Terminlal中输入:

(如果本机安装了conda,要回归到原始环境如:conda deactivate base,不要在conda环境中)

docker run -d --name searxng -p 8080:8080 -v "E:/Docker/docker_data/searxng:/etc/searxng" -e "BASE_URL=http://localhost:8080/" -e "INSTANCE_NAME=mysearch" -e "HTTP_PROXY=http://host.docker.internal:7890" -e "HTTPS_PROXY=https://host.docker.internal:7890" searxng/searxng

需要下载一会,然后完成以后,直接在浏览器中输入:http://localhost:8080/

就会看到一个简单的搜索界面:

image-20250516134344014

可以自己搜索一下看看:

相对来说比较干净,就是响应时间1.5秒感觉慢了点。

image-20250516134433761

3,配置SearXNG到cherry studio中:

直接输入:http://localhost:8080/

截图_20250516134641

配置好,点击检查,是没有用的,需要简单修改一下searXNG的配置文件:

打开自己建的路径:E:\Docker\docker_data\searXNG

里面有一个settings.yml,用记事本或者notepad++打开,第78行。给formats改成:

formats:
  - html
  - json
image-20250516134845584
image-20250516134906848
image-20250516134906848

点击保存,然后重启docker就可以,点击这里开启和关闭searXNG的浏览器:



image-20250516135034273

然后再在cherry studio中,点击检查,就可以通过了。

这个配置是满足自己DIY的需求,以及Tavily额度用完的问题,当然,自己配置的searXNG,可以自己修改设置,比如刚才提到的settings.yml。

里面2754行的代码,都是searXNG的设置,比如:

engines:
  - name: 360search
    engine: 360search
    shortcut: 360so
    disabled: true

  - name: 360search videos
    engine: 360search_videos
    shortcut: 360sov
    disabled: true

  - name: 9gag
    engine: 9gag
    shortcut: 9g
    disabled: true

  - name: acfun
    engine: acfun
    shortcut: acf
    disabled: true

这是默认设置,直接屏蔽了360和百度搜索。

searXNG的默认配置内容:

我会按功能模块来解释如何修改SearXNG的settings.yml文件,使其满足用户的需求:

1. 基本设置 (general)

  • Debug Mode: 调试模式可以启用或禁用,方便开发和调试。通过debug: true/false进行设置。
  • Instance Name: 可以更改SearXNG实例的显示名称。例如,instance_name: "My Private Search Engine"
  • Privacy Policy URL: 如果有自定义的隐私政策页面,可以在这里设置URL。privacypolicy_url: 'https://example.com/privacy'
  • Donation URL: 可以设置一个捐赠页面链接或禁用它。donation_url: 'https://example.com/donate' or donation_url: false
  • Contact URL: 设置联系方式链接。contact_url: 'mailto:search@example.com'
  • Enable Metrics: 启用或禁用记录搜索统计数据。enable_metrics: true/false
  • Open Metrics: 使用密码暴露开放的度量标准接口。open_metrics: 'password' 或 open_metrics: ''

2. 搜索设置 (search)

  • Safe Search: 设置安全搜索等级,值为0, 1, 或 2。safe_search: 1
  • Autocomplete: 选择默认的自动完成功能后端或关闭它。autocomplete: "google" or autocomplete: ""
  • Favicon Resolver: 设置默认的favicon解析器。favicon_resolver: "duckduckgo"
  • Default Language: 设置默认搜索语言。default_lang: "en-US"
  • Max Page: 控制引擎支持的页面数目。max_page: 0
  • Error Handling: 设置在引擎错误时的禁用时间。ban_time_on_fail: 5

3. 服务器设置 (server)

  • Port: 设置SearXNG监听的端口号。port: 8888
  • Bind Address: 设置绑定地址。bind_address: "0.0.0.0" 可以让所有IP地址访问,bind_address: "127.0.0.1" 只允许本地访问。
  • Base URL: 设置实例的公共URL。base_url: "http://mysearxng.com"
  • Limiter: 控制对实例的请求速率限制。limiter: true/false
  • Public Instance: 如果实例是公开的,可以设置为true以激活公开实例的功能。public_instance: true/false

4. Redis 设置 (redis)

  • URL: 设置Redis服务器的URL。url: 'redis://password@localhost:6379/0'

5. UI 设置 (ui)

  • Default Theme: 设置默认主题。default_theme: simple
  • Alignment: 控制结果的对齐方式。center_alignment: true/false
  • Infinite Scroll: 启用/禁用无限滚动。infinite_scroll: true/false
  • Default Locale: 设置默认本地化。default_locale: "en_US"
  • Hotkeys: 选择快捷键设置。hotkeys: vim or hotkeys: default

6. 插件设置 (plugins)

  • 可以启用或禁用各个插件,如计算器、单位转换等。例如:

    searx.plugins.calculator.SXNGPlugin:
      active: true

7. 搜索引擎配置 (engines)

  • 每个搜索引擎都有自己的配置项,可以包括:

    例如,禁用一个引擎:

    - name: google
      engine: google
      shortcut: g
      disabled: true
    • name: 搜索引擎名称。
    • engine: 引擎类型。
    • shortcut: 快捷方式(用于快速选择)。
    • disabled: 是否禁用该引擎。
    • 还有很多具体的配置项,比如API密钥、超时时间等。

8. URL 解析器配置 (doi_resolvers)

  • 可以配置用于解析DOI链接的服务。例如:

    doi_resolvers:
      oadoi.org: 'https://oadoi.org/'
      doi.org: 'https://doi.org/'
      doai.io: 'https://dissem.in/'

总结

修改SearXNG的settings.yml文件可以极大地自定义搜索体验。你可以根据需要启用或禁用引擎、设置隐私选项、调节界面显示、管理插件等。注意,每个搜索引擎都有特定的配置项和需求,确保正确设置API密钥、URL等以确保引擎正常工作。每次修改配置后,需要重启SearXNG服务才能生效。

这些设置可以之际修改后保存,重启docker使用,也可以在直接在首选项里设置:

image-20250516135728456
image-20250516135728456
image-20250516135755519
image-20250516135755519

很多选择,看起来比修改代码更简单一点。

默认开启和关闭的引擎:

根据您提供的设置信息,我们可以从engines部分看到哪些搜索引擎是启用的或被禁用的。在您的配置中:


启用的搜索引擎:

以下是您设置中没有被设置为 disabled: true 或 inactive: true 的搜索引擎:

  • arch linux wiki (- name: arch linux wiki)
  • artic (- name: artic)
  • arxiv (- name: arxiv)
  • bandcamp (- name: bandcamp)
  • wikipedia (- name: wikipedia)
  • bing images (- name: bing images)
  • bing news (- name: bing news)
  • bing videos (- name: bing videos)
  • crowdview (- name: crowdview, 虽然标记为disabled: true,但可能由于其他原因而未被实际禁用)
  • currency (- name: currency)
  • gentoo (- name: gentoo)
  • genius (- name: genius)
  • github (- name: github)
  • google (- name: google)
  • google images (- name: google images)
  • google news (- name: google news)
  • google scholar (- name: google scholar)
  • invidious (- name: invidious)
  • lemmy communities (- name: lemmy communities)
  • lemmy users (- name: lemmy users)
  • lemmy posts (- name: lemmy posts)
  • lemmy comments (- name: lemmy comments)
  • lingva (- name: lingva)
  • microsoft learn (- name: microsoft learn)
  • openstreetmap (- name: openstreetmap)
  • piped (- name: piped)
  • piped.music (- name: piped.music)
  • piratebay (- name: piratebay)
  • qwant (- name: qwant)
  • qwant news (- network: qwant)
  • qwant images (- network: qwant)
  • qwant videos (- network: qwant)
  • radio browser (- name: radio browser)
  • stackoverflow (- name: stackoverflow)
  • startpage (- name: startpage)
  • youtube (- name: youtube)

禁用的搜索引擎:

这里列出了您的配置文件中被明确设置为 disabled: true 或 inactive: true 的引擎:

  • 360search (- name: 360search)
  • 360search videos (- name: 360search videos)
  • 9gag (- name: 9gag)
  • baidu (- name: baidu)
  • baidu images (- name: baidu images)
  • baidu kaifa (- name: baidu kaifa)
  • chinaso news (- name: chinaso news)
  • chinaso images (- network: chinaso news)
  • chinaso videos (- network: chinaso news)
  • mwmbl (- name: mwmbl)
  • presearch (- name: presearch)
  • presearch images (- network: presearch)
  • presearch videos (- network: presearch)
  • presearch news (- network: presearch)

写在最后:

其实最方便的还是Tavily,直接联网搜索,这个searXNG更个性化一点,但是每次都需要开启dokcer才可以,平时不用的话,可以关闭。可能值得如博主说的,只有自己及不想被大数据追踪的时候,用searXNG更方便一点,或者说,更安全一点。

参考链接:https://zhuanlan.zhihu.com/p/33139503699

https://docs.tavily.com/welcome

https://dashboard.exa.ai/api-keys

【声明】内容源于网络
0
0
Dr.X的基因空间
【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
内容 176
粉丝 0
Dr.X的基因空间 【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
总阅读184
粉丝0
内容176