具体怎么实现WordPress 对搜索引擎隐藏特定的文章呢?废话不多说,直接上PHP代码,放到当前主题的functions.php中即可使用(用UTF-8编码另存为):


// 需要说明的是,如果你的WordPress站点开启了页面缓存,此功能无效

function ruikeeduse_add_custom_box() {
  if (function_exists('add_meta_box')) {    
    add_meta_box('ruikeedu_allow_se', '搜索引擎', 'ruikeedu_allow_se', 'post', 'side', 'low');
    add_meta_box('ruikeedu_allow_se', '搜索引擎', 'ruikeedu_allow_se', 'page', 'side', 'low');
  }
}
add_action('add_meta_boxes', 'ruikeeduse_add_custom_box');

function ruikeedu_allow_se() {
  global $post;
  
  //添加验证字段
  wp_nonce_field('ruikeedu_allow_se', 'ruikeedu_allow_se_nonce');
  
  $meta_value = get_post_meta($post->ID, 'ruikeedu_allow_se', true);
  if($meta_value)
    echo '<input name="ruikeedu-allow-se" type="checkbox" checked="checked" value="1" /> 屏蔽搜索引擎';
  else
    echo '<input name="ruikeedu-allow-se" type="checkbox" value="1" /> 屏蔽搜索引擎';
}

// 保存选项设置
function ruikeeduse_save_postdata($post_id) {
  // 验证
  if ( !isset( $_POST['ruikeedu_allow_se_nonce']))
    return $post_id;

  $nonce = $_POST['ruikeedu_allow_se_nonce'];

  // 验证字段是否合法
  if (!wp_verify_nonce( $nonce, 'ruikeedu_allow_se'))
    return $post_id;

  // 判断是否自动保存
  if (defined('DOING_AUTOSAVE') && DOING_AUTOSAVE) 
      return $post_id;

  // 验证用户权限
  if ('page' == $_POST['post_type']) {
    if ( !current_user_can('edit_page', $post_id))
      return $post_id;
  }
  else {
    if (!current_user_can('edit_post', $post_id))
      return $post_id;
  }
  
  // 更新设置
  if(!empty($_POST['ruikeedu-allow-se']))
    update_post_meta($post_id, 'ruikeedu_allow_se', '1');
  else
    update_post_meta($post_id, 'ruikeedu_allow_se', '0');
}
add_action('save_post', 'ruikeeduse_save_postdata');

// 对于设置不允许抓取文章和页面
// 禁止搜索引擎抓取,返回404
function do_ruikeedu_allow_se() {
  // 本功能只对文章和页面有效
  if(is_singular()) {
    global $post;
    $is_robots = 0;
    $ruikeedu_allow_se = get_post_meta($post->ID, 'ruikeedu_allow_se', true);

    if(!empty($ruikeedu_allow_se)) {
      // 下面是爬虫Agent判断关键字数组
      // 有点简单,自己优化一下吧
      $bots = array(
            'spider',
            'bot',
            'crawl',
            'Slurp',
            'yahoo-blogs',
            'Yandex',
            'Yeti',
            'blogsearch',
            'ia_archive',
            'Google',
            'baidu'
            );
    
      $useragent = $_SERVER['HTTP_USER_AGENT'];
    
      if(!empty($useragent)) {
        foreach ($bots as $lookfor) {
          if (stristr($useragent, $lookfor) !== false) {
            $is_robots = 1;
            break;
          }
        }
      }

      // 如果当前文章/页面禁止搜索引擎抓取,返回404
      // 当然你可以改成403
      if($is_robots) {
        status_header(404);
        exit;
      }
    }
  }
}
add_action('wp', 'do_ruikeedu_allow_se');

成功添加以上代码到当前主题的functions.php后,我们就可以正常使用了,完全傻瓜式。在WordPress后台文章和页面的编辑页面,右边栏底部我们可以选框。
如果当前文章/页面需要禁止搜索引擎抓取,勾选即可。勾选后,当此文章/页面被搜索引擎访问时就会返回404状态,无任何内容。如果你不喜欢给搜索引擎返回404,担心死链太多影响SEO,可以将代码中的:


status_header(404);
exit;

改为


echo "<meta name=\"robots\" content=\"noindex,noarchive\" />\n";

再将:


add_action('wp', 'do_ruikeedu_allow_se');

改成:


add_action('wp_head', 'do_ruikeedu_allow_se');

这样就直接在网页的head部分添加meta声明:


<meta name="robots" content="noindex,noarchive" />

告诉搜索引擎不要索引本页面、不要显示快照。需要注意的是,你的主题目录下的header.php中必须有以下代码:


wp_head();