Заметки по Python (5): строковые операции

Программа перевода самородков Python
Заметки по Python (5): строковые операции

Мало знаний, большой вызов! Эта статья участвует в "Необходимые знания для программистов«Творческая деятельность.

Привет всем, яодна чаша в неделю, передняя часть, которая не хочет быть пьяной (завернутой). Если написанной статье посчастливилось получить вашу благосклонность, мне очень повезло~

определение строки

так называемыйнить, состоящий из нуля или болееконечная последовательность символов.

В программе Python, если мы поместим один или несколько символов в одинарные кавычки''или двойные кавычки""Обернутый, он может представлять собой строку или может быть заключен в три одинарных или двойных кавычки. Символами строки могут быть специальные символы, английские буквы, китайские иероглифы, японские хирагана или катакана, греческие буквы, символы эмодзи и так далее.

Следующий код отображает строки в Python:

text1 = "这是用双引号包裹的字符串"
text2 = '这是用单引号包裹的字符串'
text3 = """
这一个是那个三个引号包裹的字符串
可以保留原来的格式
"""

print(text1)
print(text2)
print(text3)

Результат выполнения кода следующий:

这是用双引号包裹的字符串
这是用单引号包裹的字符串

这一个是那个三个引号包裹的字符串
可以保留原来的格式

Экранированные и необработанные строки

Использование обратной косой черты в Python"”来表示转义,也就是说Следующий контент не будет оригинальным контентом, например\nозначает новую строку, а не больше和字符n了;所以如果字符串本身包含了'"Эти специальные символы должны быть экранированы с помощью ``.

Пример кода выглядит следующим образом:

text1 = "\'Hello world\'"  # 输出被单引号包裹的Hello world
text2 = '\\Hello world\\'  # 输出被两个反斜线包裹的Hello world


print(text1)
print(text2)

Некоторые escape-символы в Python показаны ниже:

escape-символ описывать
(в конце строки) символ продолжения строки
\ символ обратной косой черты
' апостроф
" Двойные кавычки
\a колокол
\b Backspace
\000 нулевой
\n новая линия
\v вертикальная вкладка
\t горизонтальная вкладка
\r Входить
\f подача формы
\oyy восьмеричное число,yyПредставление символов, например:\o12Представляет новую строку, где o — это буква, а не цифра 0.
\xyy Шестнадцатеричное число, символ, представленный yy, например: \x0a представляет новую строку
\other Остальные символы выводятся в обычном формате

Необработанные строки — это особый тип строк в Python, начинающийся с заглавных букв.Rили строчные буквыrНачинать. В исходной строке символы "\” больше не означает управляющий символ.

Пример кода выглядит следующим образом:

text1 = "古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志"
text2 = r"古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志"

print(text1)
print(text2)

Запуск кода выглядит так:

古之立大事者,
不惟有超世之才,
亦必有坚忍不拔之志
古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志

Строковые операции

Python предоставляет множество операторов для строковых типов.

оператор конкатенации

использовать+оператор для реализации конкатенации строк, используйте*оператор для повторения содержимого строки

text1 = "Hello,world"
text2 = "!"
print(text1 + text2)  # Hello,world!
print(text2 * 10)  # !!!!!!!!!!

использовать*Очень важно реализовать повторение строки, например печать разделителя, если она написана как---------------Это будет очень хлопотно, но если вы используете- * 20это просто

операция члена

Доступно на Питонеinиnot inчтобы определить, существует ли в строке другой символ или строка,inиnot inОперации часто называют операциями принадлежности и производят логические значения.TrueилиFalse

text1 = "Hello,world"
text2 = "一碗周"
print("llo" in text1)  # True
print("周" not in text2)  # False
print("粥" not in text2)  # True

получить длину строки

через встроенные функцииlen()чтобы получить длину символов

text1 = "Hello,world"
text2 = "一碗周"
print(len(text1))  # 11
print(len(text2))  # 3

Индексирование и нарезка

Если вы ссылаетесь на символ в строке, вы можете индексировать символ из (Примечание: язык PythonЗначение индекса начинается с 0), оператор[n]nявляется целым числом, при условии, что длина строки равнаN,Такnможет быть из0прибытьN-1целое число, где0является индексом первого символа в строке, аN-1это индекс последнего символа в строке, обычно называемыйфорвардный индекс; в Python строки также можно индексировать из-1прибыть-Nцелое число, где-1это индекс последнего символа, и-Nэто индекс первого символа, обычно называемыйотрицательный индекс.

Стоит отметить, что посколькуСтроки являются неизменяемыми типами,такВы не можете изменять символы в строке путем индексации.

text1 = "Hello,world"
text2 = "一碗周"
N1 = len(text1)
N2 = len(text2)
# 获取第一个字符
print(text1[0], text1[-N1])  # H H
print(text2[0], text2[-N2])  # 一 一
# 获取最后一个字符
print(text1[N1 - 1], text1[-1])  # d d
print(text2[N2 - 1], text2[-1])  # 周 周
# 获取索引为2和-2的字符
print(text1[2], text1[-2])  # l l
print(text2[2], text2[-2])  # 周 碗

Примечание. Ошибка будет вызвана, если индекс выходит за пределы (т. е. значение индекса не находится в диапазоне индекса), например.

print(text2[222])

Сообщение об ошибке выглядит следующим образом:

IndexError: string index out of range # (字符串索引超出范围)

Если вы хотите удалить несколько символов, вы хотите нарезать строку, оператор[i:j:k]iявляется начальным индексом, символ, соответствующий индексу, может быть получен или нетN-1или-1;jявляется конечным индексом, символ, соответствующий индексу, не может быть получен0или-N;kразмер шага, значение по умолчанию1, что означает получение последовательных фрагментов соседних символов спереди назад (можно опустить), еслиkЗначение является положительным числом, т. е.форвардный индекс;еслиkотрицательное число, т.отрицательный индекс.

s = '123456789abcdef,一碗周'
# i=3, j=6, k=1的正向切片操作
print(s[3:6])       # 456

# i=-17, j=-14, k=1的正向切片操作
print(s[-17:-14])     # 456

# i=16, j=默认, k=1的正向切片操作
print(s[16:])        # 一碗周

# i=-4, j=默认, k=1的正向切片操作
print(s[-3:])       # 一碗周

# i=8, j=默认, k=2的正向切片操作
print(s[8::2])      # 9bdf一周

# i=-12, j=默认, k=2的正向切片操作
print(s[-12::2])     # 8ace,碗

# i=默认, j=默认, k=2的正向切片操作
print(s[::2])       # 13579bdf一周

# i=默认, j=默认, k=1的正向切片
print(s[:])         # 123456789abcdef,一碗周

# i=1, j=-1, k=2的正向切片操作
print(s[1:-1:2])    # 2468ace,碗

print("-"*20)

# i=7, j=1, k=-1的负向切片操作
print(s[7:1:-1])    # 876543

# i=-13, j=-19, k=-1的负向切片操作
print(s[-13:-19:-1])  # 876543

# i=8, j=默认, k=-1的负向切片操作
print(s[8::-1])     # 987654321

# i=默认, j=1, k=-1的负向切片操作
print(s[:15:-1])     # 周碗一

# i=默认, j=默认, k=-1的负向切片
print(s[::-1])      # 周碗一,fedcba987654321

# i=默认, j=默认, k=-2的负向切片
print(s[::-2])      # 周一fdb97531

iЗначение по умолчанию — первое число,jЗначение по умолчанию — число, которое заканчивается (включая само себя)

Стоит отметить, что возвращаемая строка включаетiне включаетjиз.

Строковый метод

В Python используйте методы, поставляемые со строковым типом, для обработки и работы со строками.Для переменной строкового типа используйте变量名.方法名()способ вызова его методов. На самом деле метод — это функция, привязанная к переменной определенного типа.

конвертировать случай

s1 = 'hello, world!'

# 使用capitalize方法获得字符串首字母大写后的字符串
print(s1.capitalize())   # Hello, world!
# 使用title方法获得字符串每个单词首字母大写后的字符串
print(s1.title())        # Hello, World!
# 使用upper方法获得字符串大写后的字符串
print(s1.upper())        # HELLO, WORLD!

s2 = 'GOODBYE'
# 使用lower方法获得字符串小写后的字符串
print(s2.lower())        # goodbye

найти операцию

Если вы хотите узнать, есть ли другая строка в строке спереди назад, вы можете использовать строкуfindилиindexметод.

s = 'hello, world!'

# find方法从字符串中查找另一个字符串所在的位置
# 找到了返回字符串中另一个字符串首字符的索引
print(s.find('or'))        # 8
# 找不到返回-1
print(s.find('shit'))      # -1
# index方法与find方法类似
# 找到了返回字符串中另一个字符串首字符的索引
print(s.index('or'))       # 8
# 找不到引发异常
print(s.index('shit'))     # ValueError: substring not found

в настоящее время используетfindиindexПри использовании метода также можно указать диапазон поиска через параметры метода, то есть не обязательно начинать с индекса.0положение для начала. ``найтиindex方法还有逆向查找(从后向前查找)的版本,分别是rfindrindex`

s = 'hello good world!'

# 从前向后查找字符o出现的位置(相当于第一次出现)
print(s.find('o'))       # 4
# 从索引为5的位置开始查找字符o出现的位置
print(s.find('o', 5))    # 7
# 从后向前查找字符o出现的位置(相当于最后一次出现)
print(s.rfind('o'))      # 12

суждение природы

через строкуstartswith,endswithчтобы определить, начинается ли строка и заканчивается строкой; вы также можете использоватьisМетоды в начале определяют характеристики строки, и все эти методы возвращают логические значения.

s1 = 'hello, world!'

# startwith方法检查字符串是否以指定的字符串开头返回布尔值
print(s1.startswith('He'))    # False
print(s1.startswith('hel'))   # True
# endswith方法检查字符串是否以指定的字符串结尾返回布尔值
print(s1.endswith('!'))       # True

s2 = 'abc123456'

# isdigit方法检查字符串是否由数字构成返回布尔值
print(s2.isdigit())    # False
# isalpha方法检查字符串是否以字母构成返回布尔值
print(s2.isalpha())    # False
# isalnum方法检查字符串是否以数字和字母构成返回布尔值
print(s2.isalnum())    # True

строка формата

В Python к строковому типу можно получить доступ черезcenter,ljust,rjustЭти методы выполняют центрирование, выравнивание по левому краю и выравнивание по правому краю.

s = 'hello, world'

# center方法以宽度20将字符串居中并在两侧填充*
print(s.center(20, '*'))  # ****hello, world****
# rjust方法以宽度20将字符串右对齐并在左侧填充空格
print(s.rjust(20))        #         hello, world
# ljust方法以宽度20将字符串左对齐并在右侧填充~
print(s.ljust(20, '~'))   # hello, world~~~~~~~~

Начиная с Python 2.6 добавлена ​​функция форматирования строкstr.format(), что улучшает форматирование строк.

Основной синтаксис через{}и:на замену предыдущему%.

a = 111
b = 222
print('{0} + {1} = {2}'.format(a, b, a + b)) # 111 + 222 = 333
c = "hello"
d = "world"
# 不设置指定位置,按默认顺序
print("{} {}".format(c, d))        # hello world
print("{0} {1}".format(c, d))      # hello world
print("{1} {0}".format(d, c))      # hello world
print("{1} {0} {1}".format(c, d))  # world hello world

Начиная с Python 3.6, существует более лаконичный способ написания строк формата, который заключается в добавленииfдля форматирования строки, в этомfВ строке в начале{变量名}— это заполнитель, который будет заменен значением переменной.

a = 111
b = 222
print(f"{a} + {b} = {a + b}") # 111 + 222 = 333
c = "hello"
d = "world"
print(f"{c} {d}")        # hello world

Различные операции по форматированию чисел

номер Формат вывод описывать
3.1415926 {:.2f} 3.14 два десятичных знака
3.1415926 {:+.2f} +3.14 Знак с двумя десятичными знаками
-1 {:+.2f} -1.00 Знак с двумя десятичными знаками
2.71828 {:.0f} 3 без десятичных знаков
5 {:0>2d} 05 Дополнение нулевого числа (заполнение слева, ширина 2)
5 {:x<4d} 5xxx Числа дополняют x (отступ справа, ширина равна 4)
10 {:x<4d} 10xx Числа дополняют x (отступ справа, ширина равна 4)
1000000 {:,} 1,000,000 числовой формат с разделителями-запятыми
0.25 {:.2%} 25.00% процентный формат
1000000000 {:.2e} 1.00e+09 Экспоненциальное представление
13 {:>10d} 13 Выровнять по правому краю (по умолчанию, ширина равна 10)
13 {:<10d} 13 Выровнять по левому краю (ширина 10)
13 {:^10d} 13 Выровнено по центру (ширина 10)
11 '{:b}'.format(11)<br>'{:d}'.format(11)
'{:o}'.format(11)
'{:x}'.format(11)<br>'{:#x}'.format(11)
'{:#X}'.format(11)
1011<br> 11<br> 13<br>b<br>0xb<br>0XB база

Они центрированы, выровнены по левому краю, по правому краю, за ними следует ширина, а символ с отступом после знака : может быть только одним символом.Если он не указан, он будет заполнен пробелами по умолчанию.

+означает отображение перед положительными числами+, отображается перед отрицательными числами-; (пробел) означает добавление пробела перед положительными числами b, d, o и x — двоичные, десятичные, восьмеричные и шестнадцатеричные числа соответственно.

операция обрезки

strip()Метод используется для удаления указанного символа (пробел или новая строка по умолчанию) или последовательности символов из исходной строки, обрезанной слева и справа. Этот метод очень полезен и обычно используется для удаления начальных и конечных пробелов в пользовательском вводе из-за случайного ввода.stripметод такжеlstrip(которыйleft striprstrip(которыйright strip) в двух вариантах.

s = '   一碗周  \t\n'
# strip方法获得字符串修剪左右两侧空格之后的字符串
print(s.strip())    # 一碗周

s1 = "!!!一碗周!!!"
print(s1.lstrip("!"))  # 一碗周!!!
print(s1.rstrip("!"))  # !!!一碗周