由于解码不当,WordPress 搜索特殊字符失败

更新于 2025年4月19日 WordPress 教程

由于解码不当,WordPress 搜索特殊字符失败

我正在实施 WordPress 搜索功能。 当我搜索文本“ Division’s ”(其中一个帖子中的文本)时,它返回“未找到结果”

现在为了进一步调查,我检查了核心文件: wp-includes/query.php => function parse_search()

并发现收到的 $term 编码为: Divisionxe2x80x99s

现在这个词没有被正确解码。 最终形成的 SQL 语句是:
(((test_posts.post_title LIKE ‘%Divisionxe2x80x99s%’) 或 (test_posts.post_content LIKE ‘%Divisionxe2x80x99s%’)))

所以,我想解码特殊字符以成功搜索带有特殊字符的术语。

解码方法如:

  • $string = urldecode($string);
  • $string = html_entity_decode($string);
  • $string = rawurldecode($string);
  • $string = base64_decode($string);
  • $string = utf8_decode($string);

不工作。 是否有任何插件/钩子/方法可以提供帮助?

提供的示例:

简单的searchform.php文件在这里:

if (!defined('ABSPATH')) exit(0); 
global $wp_query;
$search_query = get_search_query();
$error = get_query_var('error'); ?>
<form role="search" method="get" class="search-form form-inline" action="<?php echo esc_url(home_url('/')); ?>">
    <input id="mod-search-searchword" type="search" size="30" class="inputbox search-query search-field" placeholder="search products, content" value="<?php echo !empty($search_query) && empty($error) ? $search_query : ''; ?>" name="s" title="Search for:" />
    <input type="submit" class="button btn btn-primary" value="Search" />
</form>

现在,如果我输入像()这样的字符,它们会得到 urlencoded,并且相同的 urlencoded 字符串不会填充到带有百分比等的文本字段中。

如果我这样做:

$search_query = !empty($search_query) ? trim(sanitize_text_field(urldecode($search_query))) : '';

还是有问题,但不再是文本输入没有正确字符串的问题,问题变成了现在没有搜索结果。

如何使用 WordPress 搜索解决此问题?

wp-config.php 包含以下内容:

define('DB_CHARSET', 'utf8');
define('DB_COLLATE', '');

header.php 包含以下内容:

<!DOCTYPE html>
    <head>
        <meta charset="UTF-8">
        <meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=3.0, user-scalable=yes"/>
        <meta name="HandheldFriendly" content="true" />
        <meta name="apple-mobile-web-app-capable" content="YES" />
        <link rel="shortcut icon" href="https://stackoverflow.com/questions/38889007/wordpress-search-failed-on-special-characters-due-to-improper-decode/<?php echo get_stylesheet_directory_uri(); ?>/favicon.ico" type="image/vnd.microsoft.icon" />
        <title><?php wp_title(' - ', true, 'right'); ?></title>
        <?php wp_head(); ?>
    </head>

我的functions.php文件中有以下内容:

function livchem_searchfilter($query) {
    global $search_query;
    if ($query->is_search && !is_admin()) {
        // check if length of query > 3 but < 200
        $search_query = trim(get_search_query());
        $search_length = strlen($search_query);
        if ($search_length < 3 || $search_length > 200)
        {
            $query->set('error', 'Search term must be a minimum of 3 characters and a maximum of 200 characters.');
            return $query;
        }
        else
        {
            $query->set('post_type', array('post', 'page', 'product'));
            $query->set('posts_per_page', 20);
        }
    }
    return $query;
}
add_filter('pre_get_posts','livchem_searchfilter');

所以,我确实有 UTF-8 编码作为我的字符集 afaik。 有什么问题,为什么我在 URL 中搜索: copper(i)/(ii)返回?s=copper%2528i%2529%252F%2528ii%2529 ? 我应该为此找到 2 个结果,但我找到了 0 个结果。 为什么?

如果我将 url 更改为: ?s=copper(i)/(ii)我会看到我的 2 个结果。 但为什么我不能得到我的结果,和/或 url 是这样的? 老实说,我不太关心 url 结构是什么,但我确实希望在我在搜索表单中输入: copper(i)/(ii)时找到我的 2 个结果,但目前它没有找到任何结果。

解决方案

好的,所以您必须对搜索查询进行解码,这就是我的工作方式,现在就像魅力一样! 现在返回搜索结果,但保留 url 编码,因此这里没有任何问题。

function livchem_search_filter($s) {
    return urldecode($s);
}

add_filter('get_search_query', 'livchem_search_filter');
add_filter('the_search_query', 'livchem_search_filter');

function livchem_query_vars_search_filter($query)
{
    if ($query->is_search && !is_admin()) {
        $query->query_vars['s'] = urldecode($query->query_vars['s']);
    }

    return $query;
}
add_action('parse_query', 'livchem_query_vars_search_filter');

另外,这现在也适用于与路径相关的搜索,所以如果我将以下内容添加到我的 .htaccess 中:

RewriteCond %{QUERY_STRING} s=(.*)
RewriteRule ^$ /search/%1? [R,L]

搜索的结构如下: /search/searchterm

带有特殊字符的查询现在也可以使用。 对于 CMS 的一部分,这对于正常工作来说是多么痛苦。

你可能还喜欢下面这些文章

Auditor:WordPress 文章内容安全审核插件Auditor:WordPress 文章内容安全审核插件

本插件可以识别文章中的敏感信息,如果文章存在敏感信息,文章将会自动移动到安全的敏感隔离区,禁止任何形式的前台访问。

WordPress小说主题wpnovo,支持多语言、付费阅读、VIP会员功能的精美小说模板WordPress小说主题wpnovo,支持多语言、付费阅读、VIP会员功能的精美小说模板

//demo.imwpweb.com/wpnovo/多设备支持主题支持PC和移动端界面,独立设置,互不干扰。移动端首页(右)图:小说页面PC端和移动端的展示付费订阅主题支持付费订阅功能,支持付费单章订阅、整本小说订阅模式。

WordPress自动内链插件 WPKAL ,网站全自动增加锚链接必备插件WordPress自动内链插件 WPKAL ,网站全自动增加锚链接必备插件

什么是内链内链,顾名思义就是在同一网站域名下的内容页面之间的互相链接(自己网站的内容链接到自己网站的内部页面,也称之为站内链接)。自动内链工作原理简单来说,我们设定一些词表以及词表对应的链接,比如词是wordpress插件,链接是http

WordPress 敏感词违禁词屏蔽插件 WPWJC 介绍与下载WordPress 敏感词违禁词屏蔽插件 WPWJC 介绍与下载

这款插件的核心功能就是一点:找出文章中的违禁词、敏感词等措辞不当的词语,替换成你设置的更合适的词或者直接替换“*”号。请注意,需要同时下载站长工具箱和违禁词屏蔽插件,安装插件时也需要两个插件同时安装。

WordPress 文章自动配图、缩略图插件 WPAC 介绍与下载WordPress 文章自动配图、缩略图插件 WPAC 介绍与下载

2、自动生成的图片并非真实在磁盘中的图片,而是动态生成的,如果保存到磁盘会占用大量空间,这个空间没必要浪费,因此修改主题代码,直接将缩略图的地址改为wpac自动生成的缩略图地址是一个非常好的方案。

WordPress 相关文章插件 wprecWordPress 相关文章插件 wprec

wprec利用相似度算法计算每篇文章之间的相似度,找到与当前文章最相似的一些文章,展现在文章底部作为相关文章。我们知道,相关推荐插件推荐的原理是根据当前文章的特征(文章的高权重标签),从文章库中召回相关文章,再根据相关性评分,最后选出To