最常用且通用的方法是 ' '.join(s.split()),它按任意空白字符切分再拼接,自动去除首尾及中间多余空白,适合清洗不可控输入。
replace() 最快但不精准如果只是想把所有空格(包括连续多个)替换成单个空格,replace(' ', '') 会直接删光,而 replace(' ', ' ') 没用。真正常用的是 replace(' ', ' ') 反复调用——但这不是函数,也不鲁棒。
更实际的做法是:若确定只处理 ASCII 空格(U+0020),且不需要动制表符、换行等,可用 re.sub(r' +', ' ', s).strip()。注意它保留首尾单空格,所以得额外 strip()。
re.sub(r' +', ' ', 'a b c') → 'a b c'
\t 或 \n 的字符串无效split() + join() 最通用这是最常被推荐、也最不容易出错的方式:它把所有空白字符(空格、制表、换行、回车)当分隔符切开,再用单空格拼回去。天然过滤首尾空白和中间多余空白。
s = " hello\t world\n python " result = ' '.join(s.split()) # result → "hello world python"
s.split() 不带参数时才按任意空白切,带 '' 或 ' ' 反而失效\u3000(中文全角空格)当成普通字符,不会清除比如只删“单词之间超过 1 个的空格”,但保留单空格;或跳过引号内的空格(如 SQL 字符串字面量)。这时 split/join 失效,必须用正则或状态机。
简单情况可用 re.sub(r' {2,}', ' ', s),只压缩两个及以上连续空格:
re.sub(r' {2,}', ' ', 'a b c') # → 'a b c'
re.sub(r' {2,}', ' ', 'a b c') # → 'a b c'(不变){2,} 表示“至少两个”,比 + 更精确\t,要支持就得写成 r'[ \t\n\r]{2,}'
写一个叫 remove_extra_spaces 的函数时,最容易漏的是空字符串、纯空白、None 输入。
def remove_extra_spaces(s):
if not isinstance(s, str):
return s
retur
n ' '.join(s.split()) if s.strip() else ''None?运行时抛 AttributeError
'' 或 '\t\n '?s.split() 返回 [],' '.join([]) 是 '',其实可接受,但显式处理更清晰bytes,别硬转 str
' '.join(s.split()) 就够了;真要封装函数,重点不是逻辑,是防御性检查。