DNA binding proteins and uses thereof

A collection of guide nucleic acid-guided DNA binding proteins, including SN001-SN018, addresses the delivery limitations of Cas9 by enabling efficient and targeted DNA modification, facilitating practical applications in genome editing and gene therapy.

WO2026130570A1PCT designated stage Publication Date: 2026-06-25SHANGHAI INSTITUTE OF MATERIA MEDICA CHINESE ACADEMY OF SCIENCES

Patent Information

Authority / Receiving Office
WO · WO
Patent Type
Applications
Current Assignee / Owner
SHANGHAI INSTITUTE OF MATERIA MEDICA CHINESE ACADEMY OF SCIENCES
Filing Date
2025-12-22
Publication Date
2026-06-25

Smart Images

  • Figure PCTCN2025144351-FTAPPB-I100001
    Figure PCTCN2025144351-FTAPPB-I100001
  • Figure PCTCN2025144351-FTAPPB-I100002
    Figure PCTCN2025144351-FTAPPB-I100002
  • Figure PCTCN2025144351-FTAPPB-I100003
    Figure PCTCN2025144351-FTAPPB-I100003
Patent Text Reader

Abstract

Provided herein are guide nucleic acid-guided DNA binding proteins and derivatives and uses thereof and methods of using the same.
Need to check novelty before this filing date? Find Prior Art

Description

DNA BINDING PROTEINS AND USES THEREOF

[0001] REFERENCE TO RELATED APPLICATIONS

[0002] The instant application claims the priority to and the benefit of the filing date of PCT / CN2024 / 141002, filed on December 20, 2024, the entire contents of which, including any drawings and sequence listing, are incorporated herein by reference.

[0003] REFERENCE TO AN ELECTRONIC SEQUENCE LISTING

[0004] The disclosure contains a Sequence Listing XML file which has been submitted electronically in XML format and is hereby incorporated by reference in its entirety. Said XML copy, created on December 21, 2025, by software “WIPO Sequence” according to WIPO Standard ST. 26, is named SYP003PCT. xml, and is 57,308 bytes in size.

[0005] According to WIPO Standard ST. 26, symbol “t” is used to denote both T in DNA and U in RNA. Thus, in the instant sequence listing prepared according to ST. 26, wherever a sequence is an RNA, the T in the sequence shall be deemed as U.BACKGROUND

[0006] Cas9 (Class 2, Type II Cas) is a class of guide nucleic acid-guided DNA endonucleases and has been developed into genome editing tools for use in basic research and gene therapy development. Their nickase or deactivated (dead) versions fused with various functional domains (e.g., deaminase) have established base editing, prime editing, and epigenome editing technologies. However, the large size of Cas9 that complicates delivery has limited their use. A guide nucleic acid-guided DNA binding protein with more suitable properties for practical applications, such as, smaller size, would be desired to meet the unmet need in the art.

[0007] Citation or identification of any document in the disclosure is not an admission that such a document is available as prior art to the disclosure. Each of the references mentioned or cited in the disclosure is incorporated by reference in its entirety.SUMMARY

[0008] Included in the disclosure is a collection of guide nucleic acid-guided DNA binding proteins (or “binding proteins” for short) , including SN001-SN018 newly identified in the disclosure, and their derivatives and uses, meeting the unmet need in the art. Also included in the disclosure is a guide nucleic acid (e.g., gRNA) suitable for use to guide the corresponding guide nucleic acid-guided DNA binding proteins or derivatives thereof in the disclosure to a target DNA. Also included in the disclosure is a system or composition comprising the guide nucleic acid-guided DNA binding proteins or derivatives thereof in the disclosure and the corresponding guide nucleic acid in the disclosure suitable for use to target (e.g., function on) a target DNA. Also included in the disclosure is a method of using or use of the system in the disclosure to target (e.g., function on) a target DNA.

[0009] The binding proteins and the scaffold sequence of the guide nucleic acid corresponding to each binding protein are listed in pair in Table 1 below.

[0010] Table 1

[0011] In an aspect, provided in the disclosure is a polypeptide comprising an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, or 100%) to the amino acid sequence of any one of SEQ ID NOs: 18 and 1-17.

[0012] In another aspect, provided in the disclosure is a fusion protein comprising the polypeptide of any preceding claim and a functional domain.

[0013] In yet another aspect, provided in the disclosure is a system comprising:

[0014] (1) the polypeptide of any preceding claim or the fusion protein of any preceding claim, or a polynucleotide (e.g., a DNA, an RNA) encoding the polypeptide or the fusion protein, and

[0015] (2) a guide nucleic acid or a polynucleotide (e.g., a DNA, an RNA) encoding the guide nucleic acid, the guide nucleic acid comprising:

[0016] (i) a scaffold sequence capable of forming a complex with the polypeptide or the fusion protein; and

[0017] (ii) a guide sequence capable of hybridizing to a target sequence of a target DNA, thereby guiding the complex to the target DNA.

[0018] In yet another aspect, provided in the disclosure is a polynucleotide comprising a sequence encoding the polypeptide of any preceding claim or the fusion protein of any preceding claim.

[0019] In yet another aspect, provided in the disclosure is a vector comprising the polynucleotide of any preceding claim; optionally, the vector is a plasmid vector, a viral vector (e.g., a recombinant AAV (rAAV) vector, a recombinant lentivirus vector) , a ribonucleoprotein (RNP) , or a lipid nanoparticle (LNP) .

[0020] In yet another aspect, provided in the disclosure is a cell comprising the polypeptide of any preceding claim, the fusion protein of any preceding claim, the system of any preceding claim, the polynucleotide of any preceding claim, or the vector of any preceding claim.

[0021] In yet another aspect, provided in the disclosure is a method for modifying a target DNA, comprising contacting the target DNA with the system of any preceding claim, wherein the guide sequence is capable of hybridizing to a target sequence of the target DNA, wherein the target DNA is modified by the complex.

[0022] The details of one or more embodiments of the disclosure are set forth in the description below. Other features or advantages of the disclosure will be apparent from the following drawings and detailed description of several embodiments, and also from the appended claims. It is understood that any aspect or embodiment of the disclosure can be combined with any other one or more aspects or embodiments of the disclosure, including aspects or embodiments only described in one sub-section, only in the examples, or only in the claims, to constitute another embodiment explicitly or implicitly disclosed herein unless otherwise indicated.BRIEF DESCRIPTION OF THE DRAWINGS

[0023] An understanding of the features and advantages of the disclosure will be obtained by reference to the following detailed description that sets forth illustrative embodiments, in which the principles of the disclosure may be utilized, and the accompanying drawings of which:

[0024] Fig. 1 illustrates an exemplary target dsDNA, and an exemplary system comprising (1) an exemplary guide nucleic acid comprising a guide sequence and a scaffold sequence and (2) an exemplary DNA binding protein fused with a functional domain.

[0025] The figures herein are for illustrative purposes only and are not necessarily drawn to scale.DETAILED DESCRIPTION

[0026] The disclosure will be described with respect to particular embodiments, but the disclosure is not limited thereto in any respect. Unless defined otherwise, all technical and scientific terms used herein have the same meaning as is commonly understood by one of ordinary skill in the art to which this disclosure belongs. Terms as set forth hereinafter are generally to be understood in their plain and ordinary meaning or common sense unless indicated otherwise.

[0027] Definition

[0028] The disclosure will be described with respect to particular embodiments, but the disclosure is not limited thereto in any respect. Unless defined otherwise, all technical and scientific terms used herein have the same meaning as is commonly understood by one of ordinary skill in the art to which this disclosure belongs. Terms as set forth hereinafter are generally to be understood in their plain and ordinary meaning or common sense unless indicated otherwise.

[0029] Similar to guide nucleic acid-guided DNA binding proteins Cas9, Cas12, and IscB, the guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure are capable of binding to a target DNA (e.g., a dsDNA) as guided by a guide nucleic acid (e.g., gRNA) comprising a guide sequence targeting the DNA. The guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure may be associated with the guide nucleic acid, which localizes  / targets the guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure to a target DNA that comprises a DNA strand (i.e., a target strand) that is reversely complementary to the guide nucleic acid, or a portion thereof (e.g., the guide sequence of a guide nucleic acid) . In other words, the guide nucleic acid is “programed” to localize and bind the guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure to the target DNA such that the guide nucleic acid is also termed as a programmable nucleic acid. Binding of the guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure to the target DNA enables the guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure or a construct comprising the guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure to access to and function on the target DNA. For this purpose, the guide nucleic acid comprises a scaffold sequence responsible for (capable of) forming a complex with the guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure, and a guide sequence that is intentionally designed to be responsible for (capable of) hybridizing to a target sequence of the target DNA, thereby guiding the complex comprising the guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure and the guide nucleic acid to the target DNA such that the guide nucleic acid-guided DNA binding proteins or derivatives thereof of the disclosure is indirectly bound to the target DNA. The ability of (indirect) binding to target DNA makes the polypeptides of the disclosure guide nucleic acid-guided DNA binding proteins, similar to Cas9, Cas12, and IscB.

[0030] Referring to Fig. 1, an exemplary dsDNA is depicted to comprise a 5’ to 3’ single DNA strand and a 3’ to 5’ single DNA strand.

[0031] An exemplary guide nucleic acid is depicted to comprise a guide sequence and a scaffold sequence. The guide sequence is designed according to base pairing principle to be capable of hybridizing to a part of the 3’ to 5’ single DNA strand, and so the guide sequence “targets” that part. And thus, the 3’ to 5’ single DNA strand is referred to as a “target strand (TS) ” of the dsDNA, while the opposite 5’ to 3’ single DNA strand is referred to as a “nontarget strand (NTS) ” of the dsDNA. That part of the target strand based on which the guide sequence is designed and to which the guide sequence is capable to hybridize is referred to as a “target sequence” , while the opposite part on the nontarget strand corresponding to that part is referred to as the “protospacer sequence” , which is typically 100% (fully) reversely complementary to the target sequence, if there is no intentional or unintentional mismatch.

[0032] Generally, as is conventional in the art, a nucleic acid sequence (e.g., a DNA sequence) is written in 5’ to 3’ direction  / orientation unless explicitly indicated otherwise.

[0033] For example, for a DNA sequence of ATGC, it is usually understood as 5’-ATGC-3’ unless otherwise indicated. Its reverse sequence is 5’-CGTA-3’ . Its fully complementary sequence is 5’-TACG-3’ . Its fully reverse complementary sequence is 5’-GCAT-3’ (3’-TACG-5’ ) . Note that the fully complementary sequence usually does not have the ability to base-pair  / hybridize with the original sequence.

[0034] Generally, the double-strand sequence of a dsDNA may be represented with the sequence of its 5’ to 3’ single DNA strand conventionally written in 5’ to 3’ direction  / orientation unless otherwise indicated.

[0035] For example, for a dsDNA having a 5’ to 3’ single DNA strand of 5’-ATGC-3’ and a 3’ to 5’ single DNA strand of 3’-TACG-5’ as shown below, the dsDNA may be simply represented as 5’-ATGC-3’ .

[0036] 5’-----ATGC-----3’

[0037] 3’-----TACG-----5’

[0038] It should be noted that either the 5’ to 3’ single DNA strand or the 3’ to 5’ single DNA strand of a dsDNA can be a nontarget strand from which a protospacer sequence is selected.

[0039] In the sense of base editing, the strand on which the target nucleotide to be edited is located is termed as an edited strand, and the opposite strand is termed as a non-edited strand. As used herein, the nontarget strand is the edited strand, and the target strand is the non-edited strand.

[0040] Typically for a gene, the 5’ to 3’ single DNA strand of the gene is sense strand, and the 3’ to 5’ single DNA strand of the gene is antisense strand. Either the sense strand or the antisense strand can be a nontarget strand from which a protospacer sequence is selected.

[0041] To hybridize to a dsDNA, such as, a dsDNA 5’-ATGC-3’ , the guide sequence of a guide nucleic acid can be in one embodiment designed to have a sequence of 5’-AUGC-3’ that is fully reversely complementary to the 3’ to 5’ strand of the dsDNA (3’-TACG-5’ ) , which would be set forth in ATGC in the electric sequence listing and marked as an RNA sequence according to WIPO standard ST. 26; and in another embodiment, the guide sequence of a guide nucleic acid can be designed to have a sequence of 5’-GCAU-3’ that is fully reversely complementary to the 5’ to 3’ strand of the dsDNA (5’-ATGC-3’ ) , which would be set forth in GCAT in the electric sequence listing and marked as an RNA sequence according to WIPO standard ST. 26.

[0042] In the case that the guide sequence of a guide nucleic acid is fully reversely complementary to the target sequence of a target dsDNA and the target sequence of a target dsDNA is fully reversely complementary to the protospacer sequence of the target dsDNA, the guide sequence of a guide nucleic acid is identical to the protospacer sequence of the target dsDNA except for the difference between the U in the guide sequence due to its RNA nature and the corresponding T in the protospacer sequence due to its DNA nature. According to WIPO standard ST. 26, symbol “t” is used to denote both T in DNA and U in RNA (See “Table 1: List of nucleotides symbols” , the definition of symbol “t” is “thymine in DNA / uracil in RNA (t / u) ” ) . Thus, in the electronic sequence listing of the disclosure prepared according to WIPO standard ST.26, such a guide sequence of a guide nucleic acid could be set forth in the same sequence as a corresponding protospacer sequence of a target dsDNA in the same length. For convenience, a single SEQ ID NO entry in the electronic sequence listing can be used to denote both such a guide sequence of a guide nucleic acid and a protospacer sequence of a target dsDNA, despite whether the SEQ ID NO entry is marked as DNA or RNA in the electronic sequence listing. When a reference is made to such a SEQ ID NO entry that sets forth a protospacer  / guide sequence, it refers to either a protospacer sequence that is a DNA sequence or a guide sequence of a guide nucleic acid that is an RNA sequence depending on the context, no matter whether it is marked as a DNA or an RNA in the electronic sequence listing.

[0043] As used herein, if a DNA sequence, for example, 5’-ATGC-3’ is transcribed to an RNA sequence, with each dT (deoxythymidine, or “T” for short) in the primary sequence of the DNA sequence replaced with a U (uridine) and each dA (deoxyadenosine, or “A” for short) , dG (deoxyguanosine, or “G” for short) , and dC (deoxycytidine, or “C” for short) replaced with A (adenosine) , G (guanosine) , and C (cytidine) , respectively, resulting in 5’-AUGC-3’ , it is said in the disclosure that the DNA sequence “encodes” the RNA sequence.

[0044] As used herein, the term “polypeptide” and “protein” are used interchangeably to refer to a polymer of amino acids of any length. The polymer may be linear or branched, it may comprise modified amino acids, and it may be interrupted by non-amino acids. The terms also encompass a polymer of amino acids that has been modified, for example, by disulfide bond formation, glycosylation, lipidation, acetylation, phosphorylation, or any other manipulation, such as conjugation with a labeling component.

[0045] As used herein, the polypeptide of the disclosure may refer to any polypeptide in the disclosure, for example, a wild type or reference polypeptide in the disclosure, a mutant of a reference polypeptide in the disclosure, and more specifically, any one of the guide nucleic acid-guided DNA binding proteins of the disclosure and any derivative thereof, such as, a high-efficiency mutant of any one of the guide nucleic acid-guided DNA binding proteins of the disclosure.

[0046] As used herein, the term “reference polypeptide” is used in the context of designing and developing a new polypeptide based on an original polypeptide (e.g., a wild-type polypeptide) . For example, the original polypeptide is mutated to generate the new polypeptide. In that case, the original polypeptide is a reference of the new polypeptide and termed as a reference polypeptide. The properties of a new polypeptide can be evaluated with the reference polypeptide as a reference from which the new polypeptide is derived. For example, one or more of the properties (e.g., binding protein activity) of the new polypeptide can be compared with the reference polypeptide from which the new polypeptide is derived.

[0047] With respect to a polypeptide in the disclosure, the terms “variant” , “mutant” , and “engineered polypeptide” as used herein are used interchangeably to refer to a mutant of a reference polypeptide (e.g., a wild type polypeptide) generated by introducing an amino acid mutation (e.g., addition, deletion, substitution) into the reference polypeptide.

[0048] The amino acid sequence of a protein often starts with a most N-terminal Methionine (M) (i.e., at position 1) , since the coding sequence for the protein would require a 5’ end start codon ATG to initiate its transcription and translation, and the start codon ATG encodes amino acid Met. If a start codon ATG is already separately present upstream of the coding sequence for a polypeptide with a most N-terminal Met at position 1, then the codon for the Met in the coding sequence may be omitted as needed and hence the amino acid Met at position 1 of the polypeptide is deleted. Usually, such deletion of Met at position 1 would not affect the function of the polypeptide. In another view, the Met encoded by the upstream start codon ATG and the polypeptide lacking most N-terminal Met can together be regarded as the complete polypeptide having the N-terminal Met. In some embodiments, the polypeptide of the disclosure comprises a deletion of the most N-terminal Methionine (M) relative to a reference polypeptide. For convenience, when reference is made to any one of SEQ ID NOs: 1-18 or a derivative thereof or any other polypeptide in the disclosure, if Met is present at position 1 of any of those referred polypeptides, the reference is also made to an N-terminal truncation of any of those referred polypeptides lacking the most N-terminal Methionine (M) . For convenience, when reference is made to any one of SEQ ID NOs: 1-18 or a derivative thereof or any other polypeptide in the disclosure, if Met is not present at position 1 of any of those referred polypeptides and start codon ATG is essential for its expression, the reference is also made to the polypeptide with addition of an most N-terminal Methionine (M) .

[0049] As used herein, the description of a mutant “comprising an amino acid mutation (e.g., substitution) at a position of a reference polypeptide that is corresponding to a given position (e.g., D320) of a given polypeptide (e.g., SN018) ” or similar description means that the mutant is a mutant of the reference polypeptide (which can be the given polypeptide or another polypeptide) and comprises an amino acid mutation to be introduced at a position of the reference polypeptide corresponding to the given position of the given polypeptide.

[0050] The position of the mutation to be introduced into the reference polypeptide may be the same as the given position of the given polypeptide, for example, when the mutant is a mutant of the given polypeptide.

[0051] The position of the mutation to be introduced into the reference polypeptide may be different from the given position of the given polypeptide. For example, the mutant may be a mutant of another polypeptide (as a reference polypeptide) different from the given polypeptide but the reference polypeptide is structurally similar to the given polypeptide and therefore the position of the mutation to be introduced into the reference polypeptide can be determined according to the given position of the given polypeptide, for example, by sequence alignment of the reference polypeptide and the given polypeptide. For example, the mutant is mutated from a reference polypeptide (e.g., SN007) and comprises an amino acid mutation (e.g., substitution) at an XXX position of the reference polypeptide corresponding to YYY position of a given polypeptide (e.g., SN018) , where the reference polypeptide and the given polypeptide are not identical but structurally similar, for example, the reference polypeptide and the given polypeptide are conservative at one or more amino acid residues. For example, SN018 and SN007 in the disclosure are two different polypeptides but structurally similar and conservative at D320 (numbered according to the sequence of SN018) . Therefore, with respect to a mutant of SN007 comprising an amino acid mutation at a position corresponding to D320 of SN018, the position of the mutation to be introduced into SN007 can be determined to be position D300 of SN007 by sequence alignment of SN018 and SN007.

[0052] With respect to an amin acid residue of a polypeptide, by “conserved” or “conservative” it means that the amino acid residue is constant (not changed) across all indicated polypeptides. With respect to a motif of a polypeptide or a nucleic acid, by “conserved” or “conservative” it means that the motif is constant (not changed) across all indicated polypeptides or nucleic acids. As used herein, the term “motif” refers to a segment of a polypeptide or a nucleic acid, consisting of multiple (more than one) amino acids or nucleotides.

[0053] As used herein, the description of a mutant “comprising an amino acid mutation relative to a reference polypeptide that is corresponding to a given amino acid mutation (e.g., substitution, such as, X125Y) relative to a given polypeptide” means that the mutant is a mutant of the reference polypeptide (which can be the given polypeptide or another polypeptide) and comprises the same type of amino acid mutation (e.g., X-to-Y substitution) as the given amino acid mutation at a position in the reference polypeptide corresponding to the position (e.g., X125) of the given amino acid mutation (e.g., X125Y) numbered according to the given polypeptide. For example, a mutant comprising an amino acid substitution relative to SN007 corresponding to D320A relative to SN018 refers to the fact that SN018 comprises amino acid D at position 320, and the mutant comprises amino acid A at position 300 of SN007, from which the mutant is generated, corresponding to position 320 of SN018. The corresponding relationship of positions in two or more amino acid sequences as determined by sequence alignment is explained in the previous paragraphs.

[0054] As used herein, “amino acid mutation” includes addition, deletion, and / or substitution. Insertion is also a kind of addition that often occurs within a polypeptide. Truncation is also a kind of deletion. N-terminal or C-terminal truncation / deletion means the truncation / deletion occurs at the N-terminal or C-terminal of a polypeptide. Typically, C-terminal truncation / deletion refers to a deletion of one or more amino acids starting from the most C-terminal amino acid of a polypeptide towards the N-terminal of the polypeptide. Typically, N-terminal truncation / deletion refers to a deletion of one or more amino acids starting from the most N-terminal amino acid of a polypeptide towards the C-terminal of the polypeptide. Alternatively, in some embodiments, the most N-terminal amino acid of a polypeptide is Met (corresponding to the start codon ATG of a nucleic acid encoding the polypeptide) , and the N-terminal truncation / deletion starts from the second amino acid of the polypeptide downstream of (C’ to) (on the right side of) the Met towards the C-terminal of the polypeptide. As a specific but non-limiting example, a N-terminal truncation of 20 amino acids of a polypeptide refers to a deletion of amino acids at positions 1-20 of the polypeptide, or in some embodiments, a deletion of amino acids at positions 2-21 of the polypeptide where the most N-terminal amino acid of the polypeptide is Met and retained after the deletion.

[0055] As used herein, a “conservative substitution” refers to a substitution of an amino acid made among amino acids within one of the following four groups:

[0056] (1) non-polar amino acids, including Glycine (Gly / G) , Alanine (Ala / A) , Valine (Val / V) , Cysteine (Cys / C) , Proline (Pro / P) , Leucine (Leu / L) , Isoleucine (Ile / I) , Methionine (Met / M) , Tryptophan (Trp / W) , and Phenylalanine (Phe / F) ;

[0057] (2) negatively charged amino acids, including Aspartic Acid (Asp / D) and Glutamic Acid (Glu / E) ;

[0058] (3) polar amino acids, including Serine (Ser / S) , Threonine (Thr / T) , Tyrosine (Tyr / Y) , Asparagine (Asn / N) , and Glutamine (Gln / Q) ; and

[0059] (4) positively charged amino acids, including Lysine (Lys / K) , Arginine (Arg / R) , and Histidine (His / H) .

[0060] As used herein, the terms “nucleic acid” and “polynucleotide” are used interchangeably. They refer to a polymer of deoxyribonucleotides or ribonucleotides or their mixtures of any length in either single-or double-stranded form, and, unless otherwise stated, encompass known analogs of natural nucleotides that can function in a similar manner as naturally occurring nucleotides. The terms encompass nucleic acid-like structures with synthetic backbones, as well as amplification products. DNAs and RNAs are both polynucleotides. The polymer may include natural nucleosides (i.e., adenosine, thymidine, guanosine, cytidine, uridine, deoxyadenosine, deoxythymidine, deoxyguanosine, and deoxycytidine) , nucleoside analogs (e.g., 2-aminoadenosine, 2-thiothymidine, inosine, pyrrolo-pyrimidine, 3-methyl adenosine, C5-propynylcytidine, C5-propynyluridine, C5-bromouridine, C5-fluorouridine, C5-iodouridine, C5-methylcytidine, 7-deazaadenosine, 7-deazaguanosine, 8-oxoadenosine, 8-oxoguanosine, O (6) -methylguanine, and 2-thiocytidine) , chemically modified bases, biologically modified bases (e.g., methylated bases) , intercalated bases, modified sugars (e.g., 2′-fluororibose, ribose, 2′-deoxyribose, arabinose, and hexose) , or modified phosphate groups (e.g., phosphorothioates and 5′-N-phosphoramidite linkages) . The terms include both modified and unmodified.

[0061] As used herein, the terms “programmable nucleic acid” and “guide nucleic acid” are used interchangeably and refer to a nucleic acid-based molecule capable of guiding a polypeptide (for example, the gRNA-guided DNA binding proteins or derivatives thereof of the disclosure) to a target nucleic acid, by comprising a scaffold sequence capable of forming a complex with the polypeptide and comprising a guide sequence capable of hybridizing to the target nucleic acid. The terms include, but are not limited to, RNA-based molecules, e.g., a guide RNA.

[0062] As used herein, the terms “programmable RNA” , “RNA guide” , “guide RNA” , and “gRNA” are used interchangeably and refer to a RNA-based molecule capable of guiding a polypeptide (for example, the gRNA-guided DNA binding proteins or derivatives thereof of the disclosure) to a target nucleic acid, by comprising a scaffold sequence capable of forming a complex with the polypeptide and comprising a guide sequence capable of hybridizing to the target nucleic acid.

[0063] As used in the disclosure, the term “guide sequence” is used interchangeably with the term “spacer sequence” or “spacer” .

[0064] As used herein, the term “complex” refers to a grouping of two or more molecules, e.g., grouping of a polypeptide in the disclosure and a guide nucleic acid in the disclosure (via the scaffold sequence of the guide nucleic acid) . In some embodiments, the complex comprises a nucleic acid and a polypeptide interacting with (e.g., binding to, coming into contact with, adhering to) one another. As used herein, the term “complex” can refer to a grouping of a guide nucleic acid and a polypeptide. As used herein, the term “complex” can refer to a grouping of a guide nucleic acid, a polypeptide, and a target nucleic acid (e.g., a target DNA) .

[0065] With respect to a scaffold sequence in the disclosure, the terms “variant” and “mutant” are used interchangeably to refer to a mutant of a reference scaffold sequence (e.g., a scaffold sequence in Table 1) generated by introducing a nucleotide mutation (e.g., addition, deletion, substitution) into the reference scaffold sequence.

[0066] As described herein, the guide sequence is so designed to be capable of hybridizing to a target sequence of a target DNA. As used herein, the term “hybridize” , “hybridizing” , or “hybridization” refers to a reaction in which one or more polynucleotide sequences react to form a complex that is stabilized via hydrogen bonding between the bases of the one or more polynucleotide sequences. The hydrogen bonding may occur by Watson Crick base pairing, Hoogstein binding, or in any other sequence specific manner. As used herein, the hybridization of a guide sequence and a target sequence is so stabilized to permit a polypeptide that is complexed with a guide nucleic acid comprising the guide sequence to act (e.g., deaminize, activate) at or near the target sequence or its complement.

[0067] For the purpose of hybridization, in some embodiments, the guide sequence is reversely complementary to a target sequence. As used herein, the term “reverse complementary” refers to the ability of nucleobases of a first polynucleotide sequence, such as a guide sequence, to base pair with nucleobases of a second polynucleotide sequence, such as a target sequence, by traditional Watson-Crick base-pairing. Two reverse complementary polynucleotide sequences are able to non-covalently bind under appropriate temperature and solution ionic strength conditions. In some embodiments, a first polynucleotide sequence (e.g., a guide sequence) comprises 100% (fully) reverse complementarity to a second nucleic acid (e.g., a target sequence) . In some embodiments, a first polynucleotide sequence (e.g., a guide sequence) is reverse complementary to a second polynucleotide sequence (e.g., a target sequence) if the first polynucleotide sequence comprises at least about 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99%complementarity to the second nucleic acid (i.e., at least about 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99%of the nucleotides of the first polynucleotide sequence can base-pair with the nucleotides of the second polynucleotide sequence) . As used herein, the term “substantially complementary” refers to a first polynucleotide sequence (e.g., a guide sequence) that has a certain level of complementarity to a second polynucleotide sequence (e.g., a target sequence) (e.g., at least about 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99%of the first polynucleotide sequence can base-pair with the second polynucleotide sequence, or at most 1, 2, 3, 4, or 5 contiguous or non-contiguous nucleotides of the first polynucleotide sequence mismatch the nucleotides of the second polynucleotide sequence) . In some embodiments, the level of complementarity is such that the first polynucleotide sequence (e.g., a guide sequence) can hybridize to the second polynucleotide sequence (e.g., a target sequence) with sufficient affinity to permit a polypeptide that is complexed with the first polynucleotide sequence or a nucleic acid comprising the first polynucleotide sequence to act (e.g., deaminize, activate) on the target sequence or its complement. In some embodiments, a guide sequence that is substantially complementary to a target sequence has 100%or less than 100%complementarity to the target sequence. In some embodiments, a guide sequence that is substantially complementary to a target sequence has at least about 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99%complementarity to the target sequence, and / or has at most 1, 2, 3, 4, or 5 contiguous or non-contiguous nucleotide mismatches from the target sequence.

[0068] With respect to a system in the disclosure comprising a polypeptide (e.g., SN001 or a derivative thereof) in the disclosure and a guide nucleic acid in the disclosure, wild type system may be used to refer to a system comprising a wild type polypeptide in the disclosure (e.g., SN001 of SEQ ID NO: 1 in Table 1) and a guide nucleic acid comprising the scaffold sequence in the disclosure corresponding to the wild type polypeptide (e.g., the scaffold sequence of SEQ ID NO: 19 in Table 1) , and variant system may be used to refer to a system comprising a derivative of a wild type polypeptide (e.g., a fusion protein comprising SN001) and / or a guide nucleic acid comprising a derivative of a wild type scaffold sequence (e.g., a mutant of the scaffold sequence of SEQ ID NO: 19 in Table 1) .

[0069] As used herein, the terms “protospacer adjacent motif (PAM) ” and “target adjacent motif (TAM) ” are used interchangeably and refer to a short nucleotide sequence (or a motif) immediately 5’ to a protospacer sequence on the nontarget strand of a target dsDNA recognizable by a polypeptide of the disclosure.

[0070] As used herein, the term “identity” or “sequence identity” refers to the overall relatedness between polymeric molecules, e.g., between nucleic acids (e.g., DNA and / or RNA) and / or between polypeptides. In some embodiments, polymeric molecules are considered to be “substantially identical” to one another if their sequences are at least 80%, 85%, 90%, 95%, or 99%identical. Calculation of the percent identity of two nucleic acids or polypeptides, for example, can be performed by aligning the two sequences for optimal comparison purpose (e.g., gaps can be introduced in one or both of a first and a second sequences for optimal alignment, and non-identical sequences can be disregarded for comparison purposes) . In certain embodiments, the length of a sequence aligned for comparison purpose is at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, at least 95%, or 100%of the length of a reference sequence. The nucleotides or amino acids at corresponding positions are then compared. The comparison of sequences and determination of percent identity between two sequences can be accomplished using a mathematical algorithm. As is well known in the art, nucleic acids or polypeptides may be compared using any of a variety of algorithms, including those available in commercially available computer programs such as BLASTN for nucleotide sequences and BLASTP, gapped BLAST, and PSI-BLAST for amino acid sequences. In some embodiments, the sequence identity is calculated by global alignment, for example, using the Needleman-Wunsch algorithm, for example, using an online tool at ebi. ac. uk / Tools / psa / emboss_needle / . In some embodiments, the sequence identity is calculated by local alignment, for example, using the Smith-Waterman algorithm, for example, using an online tool at ebi. ac. uk / Tools / psa / emboss_water / .

[0071] As used herein, the terms “upstream” and “downstream” refer to relative positions within a single nucleic acid (e.g., DNA) or within a single polypeptide. “Upstream” and “downstream” relate to the 5’ to 3’ direction of a single nucleic acid, respectively, in which transcription occurs, or N-to C-orientation of a single polypeptide, respectively, in which translation occurs. For a first sequence and a second sequence present on the same strand of a single nucleic acid written in 5’ to 3’ direction or a single polypeptide written in N-to-C orientation, the first sequence is upstream of the second sequence when the 3’ end or C-terminal of the first sequence is on the left side of the 5’ end or N-terminal of the second sequence, and the first sequence is downstream of the second sequence when the 5’ end or N-terminal of the first sequence is on the right side of the 3’ end or C-terminal of the second sequence. For example, a promoter is usually at the upstream of a coding sequence under the regulation of the promoter; and on the other hand, a coding sequence under the regulation of a promoter is usually at the downstream of the promoter.

[0072] As used herein, the term “regulatory element” refers to a DNA sequence that controls or impacts one or more aspects of transcription and / or expression and is intended to include promoters, enhancers, silencers, termination signals, internal ribosome entry sites (IRES) , and other expression control elements (e.g., transcription termination signals such as polyadenylation signals and poly-U sequences) . Regulatory elements include those that direct constitutive expression of a nucleotide sequence in many types of host cells and those that direct expression of a nucleotide sequence only in certain host cells (e.g., tissue-specific regulatory sequences) . Regulatory elements may also direct expression in a time-dependent manner, e.g., in a cell cycle-dependent or developmental stage-dependent manner, which may or may not be tissue or cell type specific.

[0073] As used herein, the term “operably linked” refers to a juxtaposition wherein the components described are in a relationship permitting them to function in their intended manner. A regulatory element “operably linked” to a functional element is associated in such a way that transcription, expression, and / or activity of the functional element is achieved under conditions compatible with the regulatory element. In some embodiments, “operably linked” regulatory elements are contiguous (e.g., covalently linked) with the functional elements of interest; in some embodiments, regulatory elements act in trans to or otherwise at a distance from the functional elements of interest.

[0074] As used herein, the term “cell” is understood to refer not only to a particular individual cell, but to the progeny or potential progeny of the cell. Because certain modifications may occur in succeeding generations due to either mutation or environmental influences, such progeny may not, in fact, be identical to the parent cell, but are still included within the scope of the term.

[0075] As used herein, the term “in vivo” means inside the body of an organism, and the terms “ex vivo” or “in vitro” means outside the body of an organism.

[0076] As used herein, the term “treat” , “treatment” , or “treating” is an approach for obtaining beneficial or desired results including clinical results. For purposes of the disclosure, the beneficial or desired clinical results include, but are not limited to, one or more of the following: alleviating one or more symptoms resulting from a disease, diminishing the extent of a disease, stabilizing a disease (e.g., delaying the worsening of a disease) , delaying the spread (e.g., metastasis) of a disease, delaying the recurrence of a disease, reducing recurrence rate of a disease, delay or slowing the progression of a disease, ameliorating a disease state, providing a remission (partial or total) of a disease, decreasing the dose of one or more other medications required to treat a disease, delaying the progression of a disease, increasing the quality of life, and prolonging survival. Also encompassed by the term is a reduction of pathological consequence of a disease (such as cancer) . The methods of the disclosure contemplate any one or more of these aspects of treatment.

[0077] As used herein, the term “disease” includes the terms “disorder” and “condition” and is not limited to those specific diseases that have been medically or clinically defined.

[0078] As used herein, reference to “not” a value or parameter generally means and describes “other than” a value or parameter. For example, the method is not used to treat cancer of type X means the method may be used to treat cancer of types other than X.

[0079] As used herein, the singular forms “a” , “an” , and “the” include plural referents unless the context clearly dictates otherwise. That is, articles “a / an” and “the” are used herein to refer to one or more than one (i.e., at least one) grammatical object of the article. For example, “an element” means one element or more than one element, e.g., two elements.

[0080] As used herein, the term “and / or” in a phrase such as “A and / or B” is intended to mean either or both of the alternatives, including both A and B, A or B, A (alone) , and B (alone) . Likewise, the term “and / or” in a phrase such as “A, B, and / or C” is intended to encompass each of the following embodiments: A, B, and C; A, B, or C; A or C; A or B; B or C; A and C; A and B; B and C; A (alone) ; B (alone) ; and C (alone) .

[0081] As used herein, when the term “about” is ahead of a serious of numbers (for example, about 1, 2, 3) , it is understood that each of the serious of numbers is modified by the term “about” (that is, about 1, about 2, about 3) . The term “about X-Y” used herein has the same meaning as “about X to about Y. ”

[0082] As used herein, a numerical range includes the end values of the range and each specific value within the range, for example, “16 to 100 nucleotides” includes 16 nucleotides and 100 nucleotides and each specific value between 16 and 100, e.g., 17, 23, 34, 52, 78.

[0083] It is understood that embodiments of the disclosure described herein include “consisting” and / or “consisting essentially of” embodiments.

[0084] It is further noted that the claims may be drafted to exclude any optional element. As such, this statement is intended to serve as antecedent basis for use of such exclusive terminology as “solely” , “only” , and the like in connection with the recitation of claim elements, or use of a “negative” limitation.

[0085] I. Overview

[0086] The disclosure provides, in part, guide nucleic acid-guided DNA binding proteins including SEQ ID NOs: 18 and 1-17, and derivatives (including mutants and fusion proteins) thereof, systems comprising the guide nucleic acid-guided DNA binding proteins or the derivative, and uses thereof.

[0087] The guide nucleic acid-guided DNA binding proteins and derivatives thereof provided in the disclosure are CRISPR-associated proteins (Cas proteins) . The systems provided in the disclosure are CRISPR-Cas systems.

[0088] II. Representative polypeptides

[0089] In an aspect, the disclosure provides a guide nucleic acid-guided DNA binding protein as set forth in any one of SEQ ID NOs: 18 and 1-17. In some embodiments, the disclosure provides a wild type polypeptide as set forth in any one of SEQ ID NOs: 18 and 1-17. In some embodiments, the disclosure provides a reference polypeptide as set forth in any one of SEQ ID NOs: 18 and 1-17. In some embodiments, the disclosure provides a reference polypeptide that is a polypeptide in the disclosure.

[0090] In another aspect, the disclosure provides a polypeptide comprising an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, or 100%) to the amino acid sequence of any one of SEQ ID NOs: 18 and 1-17.

[0091] The derivatives of the guide nucleic acid-guided DNA binding proteins of the disclosure include, but not limited to, mutants of the guide nucleic acid-guided DNA binding proteins, and fusion proteins comprising the guide nucleic acid-guided DNA binding proteins or the mutants.

[0092] (I) Mutants

[0093] In some embodiments, the polypeptide provided in the disclosure is a mutant of a reference polypeptide (which could be any polypeptide in the disclosure, e.g., any one of SEQ ID NOs: 18 and 1-17) in the disclosure, i.e., comprising an (e.g., one or more) amino acid substitution relative to (compared to) the reference polypeptide.

[0094] In some embodiments, the polypeptide has one or more of the properties, including but not limited to the followings, compared to the reference polypeptide:

[0095] (1) higher ability to bind to a target dsDNA;

[0096] (2) higher base editing efficiency when used in a base editor for base editing;

[0097] (3) higher prime editing efficiency when used in a prime editor for prime editing;

[0098] (4) higher epigenomic editing efficiency when used in an epigenomic editor for epigenomic editing;

[0099] (5) higher transcription activating efficiency when used in a transcriptional activator for transcriptional activation;

[0100] (6) lower off-target activity; and

[0101] (7) wider PAM recognition.

[0102] In some embodiments, the polypeptide comprises an amino acid substitution relative to (compared to) the amino acid sequence of any one of SEQ ID NOs: 18 and 1-17.

[0103] In some embodiments, the polypeptide comprising the amino acid substitution comprises an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%) and less than 100%to the amino acid sequence of any one of SEQ ID NOs: 18 and 1-17.

[0104] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, and 479 of SEQ ID NO: 1.

[0105] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, and 504 of SEQ ID NO: 2.

[0106] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, and 507 of SEQ ID NO: 3.

[0107] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, and 511 of SEQ ID NO: 4.

[0108] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, and 543 of SEQ ID NO: 5.

[0109] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, and 547 of SEQ ID NO: 6.

[0110] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, and 560 of SEQ ID NO: 7.

[0111] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, and 562 of SEQ ID NO: 8.

[0112] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, and 562 of SEQ ID NO: 9.

[0113] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, and 567 of SEQ ID NO: 10.

[0114] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, and 585 of SEQ ID NO: 11.

[0115] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, and 585 of SEQ ID NO: 12.

[0116] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, and 587 of SEQ ID NO: 13.

[0117] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, and 589 of SEQ ID NO: 14.

[0118] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, and 590 of SEQ ID NO: 15.

[0119] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, and 593 of SEQ ID NO: 16.

[0120] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, and 594 of SEQ ID NO: 17.

[0121] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position or that is a position selected from the group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614, 615, 616, 617, 618, 619, 620, 621, and 622 of SEQ ID NO: 18.

[0122] In some embodiments, the amino acid substitution is a conservative amino acid substitution or a non-conservative amino acid substitution.

[0123] In some embodiments, the amino acid substitution is an amino acid substitution with an amino acid residue that is different from the original amino acid residue at the position of any one of SEQ ID NOs: 18 and 1-17.

[0124] In some embodiments, the amino acid substitution is an amino acid substitution with

[0125] (1) a non-polar amino acid residue (such as, Glycine (Gly / G) , Alanine (Ala / A) , Valine (Val / V) , Cysteine (Cys / C) , Proline (Pro / P) , Leucine (Leu / L) , Isoleucine (Ile / I) , Methionine (Met / M) , Tryptophan (Trp / W) , Phenylalanine (Phe / F) ,

[0126] (2) a polar amino acid residue (such as, Serine (Ser / S) , Threonine (Thr / T) , Tyrosine (Tyr / Y) , Asparagine (Asn / N) , Glutamine (Gln / Q) ) ,

[0127] (3) a positively charged amino acid residue (such as, Lysine (Lys / K) , Arginine (Arg / R) , Histidine (His / H) ) , or

[0128] (4) a negatively charged amino acid residue (such as, Aspartic Acid (Asp / D) , Glutamic Acid (Glue / E) ) .

[0129] In some embodiments, the amino acid substitution is an amino acid substitution with a positively charged amino acid residue, such as, Arginine (R) .

[0130] In some embodiments, the amino acid substitution is an amino acid substitution with a non-polar amino acid residue, such as, Alanine (A) .

[0131] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position selected from the group consisting of 17, 26, 27, 30, 34, 42, 55, 59, 60, 67, 87, 91, 94, 95, 112, 132, 155, 184, 212, 217, 219, 227, 280, 289, 355, 367, 368, 370, 371, 375, 397, 409, 410, 422, 425, 428, 429, 432, 462, 489, 496, 507, 552, 557, 558, 568, 572, 579, 586, 601, 602, 603, 604, 606, 607, 608, 609, 613, 614, 615, 618, 619, 620, 621, and 622 of SEQ ID NO: 18.

[0132] In some embodiments, the polypeptide comprises an amino acid substitution at a position that is or that is corresponding to a position selected from the group consisting of T17, L26, L27, P30, S34, A42, C55, Q59, A60, E67, D87, A91, Q94, G95, A112, A132, L155, I184, F212, Q217, G219, A227, Q280, H289, I355, E367, T368, D370, K371, V375, I397, F409, W410, V422, Y425, E428, T429, H432, H462, D489, P496, E507, Q552, S557, L558, W568, A572, N579, A586, K601, K602, K603, A604, P606, T607, S608, S609, H613, D614, E615, S618, P619, T620, G621, and S622 of SEQ ID NO: 18.

[0133] In some embodiments, the polypeptide comprises an amino acid substitution that is or that is corresponding to an amino acid substitution selected from the group consisting of T17R, L26R, L27R, P30R, S34R, A42R, C55R, Q59R, A60R, E67R, D87R, A91R, Q94R, G95R, A112R, A132R, L155R, I184R, F212R, Q217R, G219R, A227R, Q280R, H289R, I355R, E367R, T368R, D370R, K371R, V375R, I397R, F409R, W410R, V422R, Y425R, E428R, T429R, H432R, H462R, D489R, P496R, E507R, Q552R, S557R, L558R, W568R, A572R, N579R, A586R, K601R, K602R, K603R, A604R, P606R, T607R, S608R, S609R, H613R, D614R, E615R, S618R, P619R, T620R, G621R, and S622R relative SEQ ID NO: 18.

[0134] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position selected from the group consisting of 55, 60, 67, 87, 91, 94, 95, 184, 219, 289, 355, 367, 368, 370, 375, 397, 422, 425, 428, 429, 462, 489, 496, and 507 of SEQ ID NO: 18; optionally, the amino acid substitution is an amino acid substitution with Arginine (R) .

[0135] In some embodiments, the polypeptide comprises an amino acid substitution that is or that is corresponding to an amino acid substitution selected from the group consisting of C55R, A60R, E67R, D87R, A91R, Q94R, G95R, I184R, G219R, H289R, I355R, E367R, T368R, V375R, I397R, V422R, Y425R, E428R, T429R, H462R, D489R, P496R, and E507R relative SEQ ID NO: 18.

[0136] In some embodiments, the polypeptide comprises an amino acid substitution at a position that is or that is corresponding to a position selected from the group consisting of C55, I184, G219, H289, V422, Y425, P496, and E507 of SEQ ID NO: 18.

[0137] In some embodiments, the polypeptide comprises an amino acid substitution that is or that is corresponding to an amino acid substitution selected from the group consisting of C55R, I184R, G219R, H289R, V422R, Y425R, P496R, and E507R relative to SEQ ID NO: 18.

[0138] In some embodiments, the polypeptide comprises an amino acid substitution selected from the group consisting of:

[0139] (1) C55R;

[0140] (2) A60R;

[0141] (3) E67R;

[0142] (4) D87R;

[0143] (5) A91R;

[0144] (6) Q94R;

[0145] (7) G95R;

[0146] (8) I184R;

[0147] (9) G219R;

[0148] (10) H289R;

[0149] (11) I355R;

[0150] (12) E367R;

[0151] (13) T368R;

[0152] (14) D370R;

[0153] (15) V375R;

[0154] (16) I397R;

[0155] (17) V422R;

[0156] (18) Y425R;

[0157] (19) E428R;

[0158] (20) T429R;

[0159] (21) H462R;

[0160] (22) D489R;

[0161] (23) P496R;

[0162] (24) E507R;

[0163] (25) C55R + I184R ( “v1” ) ;

[0164] (26) C55R + I184R + G219R;

[0165] (27) C55R + I184R + H289R;

[0166] (28) C55R + I184R + G219R + H289R;

[0167] (29) C55R + I184R + P496R;

[0168] (30) C55R + I184R + E507R;

[0169] (31) C55R + I184R + P496R + E507R;

[0170] (32) C55R + I184R + G219R + H289R + P496R;

[0171] (33) C55R + I184R + G219R + H289R + P496R + E507R ( “v2” ) ;

[0172] (34) C55R + I184R + G219R + H289R + P496R + E507R + A60R;

[0173] (35) C55R + I184R + G219R + H289R + P496R + E507R + E67R;

[0174] (36) C55R + I184R + G219R + H289R + P496R + E507R + D87R;

[0175] (37) C55R + I184R + G219R + H289R + P496R + E507R + A91R;

[0176] (38) C55R + I184R + G219R + H289R + P496R + E507R + Q94R;

[0177] (39) C55R + I184R + G219R + H289R + P496R + E507R + G95R;

[0178] (40) C55R + I184R + G219R + H289R + P496R + E507R + I355R;

[0179] (41) C55R + I184R + G219R + H289R + P496R + E507R + E367R;

[0180] (42) C55R + I184R + G219R + H289R + P496R + E507R + T368R;

[0181] (43) C55R + I184R + G219R + H289R + P496R + E507R + D370R;

[0182] (44) C55R + I184R + G219R + H289R + P496R + E507R + V375R;

[0183] (45) C55R + I184R + G219R + H289R + P496R + E507R + E428R;

[0184] (46) C55R + I184R + G219R + H289R + P496R + E507R + I397R;

[0185] (47) C55R + I184R + G219R + H289R + P496R + E507R + V422R ( “v3” ) ;

[0186] (48) C55R + I184R + G219R + H289R + P496R + E507R + Y425R;

[0187] (49) C55R + I184R + G219R + H289R + P496R + E507R + T429R;

[0188] (50) C55R + I184R + G219R + H289R + P496R + E507R + H462R;

[0189] (51) C55R + I184R + G219R + H289R + P496R + E507R + D489R; and

[0190] any combination of (1) - (51) ;

[0191] relative to SEQ ID NO: 18.

[0192] Although not essential, the polypeptide of the disclosure may further comprise one or more amino acid mutations intended to decrease, eliminate, or abolish the potential endonuclease activity, if any, that the polypeptide might have but not essentially have. Such mutations are not necessary but may be introduced for safety purpose since the endonuclease activity of the polypeptide, if present, is not desired when the polypeptide is used as a DNA binding protein to carry a functional domain to a target dsDNA to allow the functional domain to function on the target dsDNA rather than relying on the endonuclease activity of the polypeptide to cleave the target dsDNA. Such mutations may not have substantial influence on the desired DNA binding property of the polypeptide. The polypeptide of the disclosure can still be functional as a DNA binding protein without such mutations.

[0193] In some embodiments, such mutations are at a position of D194 and / or E352 of SEQ ID NO: 1. In some embodiments, such mutations are at a position of D299 and / or E387 of SEQ ID NO: 2. In some embodiments, such mutations are at a position of D251 and / or E396 of SEQ ID NO: 3. In some embodiments, such mutations are at a position of D242 and / or E369 of SEQ ID NO: 4. In some embodiments, such mutations are at a position of D286 and / or E438 of SEQ ID NO: 5. In some embodiments, such mutations are at a position of D292 and / or E445 of SEQ ID NO: 6. In some embodiments, such mutations are at a position of D300 and / or E453 of SEQ ID NO: 7. In some embodiments, such mutations are at a position of D309 and / or E462 of SEQ ID NO: 8. In some embodiments, such mutations are at a position of D301 and / or E458 of SEQ ID NO: 9. In some embodiments, such mutations are at a position of D306 and / or E459 of SEQ ID NO: 10. In some embodiments, such mutations are at a position of D308 and / or E470 of SEQ ID NO: 11. In some embodiments, such mutations are at a position of D308 and / or E470 of SEQ ID NO: 12. In some embodiments, such mutations are at a position of D310 and / or E472 of SEQ ID NO: 13. In some embodiments, such mutations are at a position of D313 and / or E475 of SEQ ID NO: 14. In some embodiments, such mutations are at a position of D272 and / or E427 of SEQ ID NO: 15. In some embodiments, such mutations are at a position of D327 and / or E483 of SEQ ID NO: 16. In some embodiments, such mutations are at a position of D318 and / or E481 of SEQ ID NO: 17. In some embodiments, such mutations are at a position of D320 and / or E473 of SEQ ID NO: 18.

[0194] In some embodiments, such mutations are amino acid substitutions D194A and E352A relative to SEQ ID NO: 1. In some embodiments, such mutations are amino acid substitutions D299A and E387A relative to SEQ ID NO: 2. In some embodiments, such mutations are amino acid substitutions D251A and E396A relative to SEQ ID NO: 3. In some embodiments, such mutations are amino acid substitutions D242A and E369A relative to SEQ ID NO: 4. In some embodiments, such mutations are amino acid substitutions D286A and E438A relative to SEQ ID NO: 5. In some embodiments, such mutations are amino acid substitutions D292A and E445A relative to SEQ ID NO: 6. In some embodiments, such mutations are amino acid substitutions D300A and E453A relative to SEQ ID NO: 7. In some embodiments, such mutations are amino acid substitutions D309A and E462A relative to SEQ ID NO: 8. In some embodiments, such mutations are amino acid substitutions D301A and E458A relative to SEQ ID NO: 9. In some embodiments, such mutations are amino acid substitutions D306A and E459A relative to SEQ ID NO: 10. In some embodiments, such mutations are amino acid substitutions D308A and E470A relative to SEQ ID NO: 11. In some embodiments, such mutations are amino acid substitutions D308A and E470A relative to SEQ ID NO: 12. In some embodiments, such mutations are amino acid substitutions D310A and E472A relative to SEQ ID NO: 13. In some embodiments, such mutations are amino acid substitutions D313A and E475A relative to SEQ ID NO: 14. In some embodiments, such mutations are amino acid substitutions D272A and E427A relative to SEQ ID NO: 15. In some embodiments, such mutations are amino acid substitutions D327A and E483A relative to SEQ ID NO: 16. In some embodiments, such mutations are amino acid substitutions D318A and E481A relative to SEQ ID NO: 17. In some embodiments, such mutations are amino acid substitutions D320A and E473A relative to SEQ ID NO: 18.

[0195] In some embodiments, the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position selected from the group consisting of D320 and E473 of SEQ ID NO: 18, for example, the positions of SEQ ID NO: 7 corresponding to the positions of D320 and E473 of SEQ ID NO: 18 are positions D300 and E453 of SEQ ID NO: 7, respectively; optionally, the amino acid substitution is an amino acid substitution with a non-polar amino acid residue, such as, Alanine (A) .

[0196] In some embodiments, the polypeptide is endonuclease deficient. In some embodiments, the polypeptide is catalytically inactive.

[0197] In some embodiments, the polypeptide comprises amino acid substitutions of (a) C55R + I184R + G219R + H289R + P496R + E507R + V422R, relative to SEQ ID NO: 18; or (b) C55R + I184R + G219R + H289R + P496R + E507R + V422R + D320A + E473A, relative to SEQ ID NO: 18.

[0198] In some embodiments, the polypeptide is capable of recognizing a protospacer adjacent motif (PAM) comprising, consisting essentially of, or consisting of 5’-NNN-3’ immediately 5’ to a protospacer sequence of a target DNA, wherein N is A, T, G, or C. In some embodiments, the polypeptide is capable of recognizing a PAM comprising, consisting essentially of, or consisting of 5’-TTN-3’ immediately 5’ to a protospacer sequence of a target DNA, wherein N is A, T, G, or C.

[0199] (II) Fusion proteins

[0200] The polypeptide of the disclosure can be linked to or fused to a functional domain to form a fusion protein. Alternatively, the polypeptide itself is a fusion protein herein. The functional domain is usually heterologous to the polypeptide.

[0201] Therefore, in an aspect, the disclosure provides a fusion protein comprising the polypeptide of the disclosure and a functional domain.

[0202] In some embodiments, the polypeptide is fused to a functional domain to form a fusion protein. The fusion protein can be regarded as a derivative of the polypeptide or as a mutant of the polypeptide with an amino acid addition at the N-terminal and / or C-terminal of the polypeptide or with an amino acid insertion within the polypeptide. The polypeptide in the disclosure may also refer to the fusion protein of the disclosure depending on the context.

[0203] In some embodiments, the functional domain is fused to the N-terminal of (N-terminally fused to) or the C-terminal of (C-terminally fused to) the polypeptide or inserted into (fused internally to) the polypeptide.

[0204] In some embodiments, the functional domain is fused to the polypeptide via a linker, e.g., a XTEN linker, a GS linker. As used herein, the term “GS linker” refers to a linker comprising one or more Gly (G; glycine) and one or more Ser (S; serine) in any sequence. In some embodiments, a GS linker may contain an additional sequence, e.g., a XTEN linker, a NLS, within the GS linker.

[0205] In some embodiments, the fusion protein contains the polypeptide and more than one (e.g., 2, 3, 4, 6, or more) functional domain. In some embodiments, two functional domains are fused together via a linker in the disclosure.

[0206] In some embodiments, the functional domain has transposase activity, methylase activity, demethylase activity, translation activation activity, translation repression activity, transcription activation activity, transcription repression activity, deaminase activity, transcription release factor activity, chromatin modifying or remodeling activity, histone modification activity, nuclease activity, single-strand RNA cleavage activity, double-strand RNA cleavage activity, single-strand DNA cleavage activity, double-strand DNA cleavage activity, nucleic acid binding activity, detectable activity, or any combination thereof.

[0207] In some embodiments, the functional domain is selected from the group consisting of a nuclear localization signal (NLS) , a nuclear export signal (NES) , a deaminase or a catalytic domain thereof, an uracil glycosylase inhibitor (UGI) , an uracil glycosylase (UNG) , a methylpurine glycosylase (MPG) , a methylase or a catalytic domain thereof, a demethylase or a catalytic domain thereof, an transcription activating domain (e.g., VP64, VPR, or miniVPR) , an transcription inhibiting domain (e.g., KRAB moiety or SID moiety) , a reverse transcriptase or a catalytic domain thereof, an exonuclease or a catalytic domain thereof (e.g., T5 exonuclease) , a histone residue modification domain, a nuclease catalytic domain (e.g., FokI) , a transcription modification factor, a light gating factor, a chemical inducible factor, a chromatin visualization factor, a targeting polypeptide for providing binding to a cell surface portion on a target cell or a target cell type, a reporter (e.g., fluorescent) polypeptide or a detection label (e.g., GST, HRP, CAT, GFP, HcRed, DsRed, CFP, YFP, BFP) , a localization signal, a polypeptide targeting moiety, a DNA binding domain (e.g., MBP, Lex A DBD, Gal4 DBD) , an epitope tag (e.g., His, myc, V5, FLAG, HA, VSV-G, Trx, etc) , a transcription release factor, an HDAC, a moiety having RNA cleavage activity, a moiety having ssDNA cleavage activity, a moiety having dsDNA cleavage activity, a DNA or RNA ligase, a functional domain exhibiting activity to modify a target DNA selected from the group consisting of: methyltransferase activity, DNA repair activity, DNA damage activity, dismutase activity, alkylation activity, dealkylation activity, depurination activity, oxidation activity, deoxidation activity, pyrimidine dimer forming activity, integrase activity, transposase activity, recombinase activity, polymerase activity, ligase activity, helicase activity, photolyase activity, glycosylase activity, acetyl transferase activity, deacetylase activity, kinase activity, phosphatase activity, ubiquitin ligase activity, deubiquitination activity, adenylation activity, deadenylation activity, SUMOylation activity, deSUMOylation activity, ribosylation activity, deribosylation activity, myristoylation activity, demyristoylation activity, glycosylation activity (e.g., from O-GlcNAc transferase) , deglycosylation activity, and a catalytic domain thereof, and a functional fragment thereof, and any combination thereof.

[0208] In some embodiments, the fusion protein comprises a NLS at the N-terminal and / or the C-terminal of the polypeptide. In some embodiments, the fusion protein comprises one or two NLS at the N-terminal and / or the C-terminal of the polypeptide.

[0209] In some embodiments, the fusion protein comprises a NLS at the N-terminal and / or the C-terminal of the functional domain. In some embodiments, the fusion protein comprises one or two NLS at the N-terminal and / or the C-terminal of the functional domain.

[0210] In some embodiments, the NLS comprises or is SV40 NLS, bpSV40 NLS (BP NLS, bpNLS) , NP NLS (Xenopus laevis Nucleoplasmin NLS, nucleoplasmin NLS) , or c-myc NLS.

[0211] (i) Base editor

[0212] In some embodiments, the functional domain comprises a deaminase or a catalytic domain thereof.

[0213] In some embodiments, the functional domain comprises an uracil glycosylase (UNG) .

[0214] In some embodiments, the functional domain comprises a methylpurine glycosylase (MPG) .

[0215] The polypeptide of the disclosure can be used to replace the napDNAbp / napDNAbd in PCT / CN2023 / 094023 (AYBE) and PCT / CN2024 / 089874 (gBE) to constitute AYBE base editor and gBE base editor, respectively, which two PCT applications are incorporated herein by reference in their entities.

[0216] (a) Adenine Base editor

[0217] In some embodiments, the deaminase or catalytic domain thereof is an adenine deaminase or a catalytic domain thereof (e.g., tRNA adenosine deaminase (TadA) , such as, TadA8e, TadA8.17, TadA8.20, TadA9, TadA8e-V106W, TadA8EV106W+D108Q TadA-CDa, TadA-CDb, TadA-CDc, TadA-CDd, TadA-CDe, TadA-dual, TADAC-1.2, TADAC-1.14, TADAC-1.17, TADAC-1.19, TADAC-2.5, TADAC-2.6, TADAC-2.9, TADAC-2.19, TADAC-2.23, TadA8e-N46L, TadA8e-N46P, TadA* (8.17m) , TadA (8.8m) ) .

[0218] In some embodiments, the adenine deaminase or a catalytic domain thereof is TadA8EV106W.

[0219] In some embodiments, the fusion protein comprises the polypeptide and the adenine deaminase or a catalytic domain thereof.

[0220] In some embodiments, the fusion protein comprises, from N-to C-terminus, an optional NLS, the adenine deaminase or a catalytic domain thereof, an optional linker, the polypeptide, and an optional NLS.

[0221] (b) Cytosine Base editor

[0222] In some embodiments, the deaminase or catalytic domain thereof is a cytosine deaminase or a catalytic domain thereof (e.g., an apolipoprotein B mRNA-editing complex (APOBEC) family deaminase, an activation induced deaminase (AID) , a cytidine deaminase 1 from Petromyzon marinus (pmCDA1) , DddA, or a functional variant thereof, e.g., APOBEC1 (rAPOBEC1) , APOBEC2, APOBEC3, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3F, APOBEC3G, APOBEC3H, hAPOBEC3-W104A) .

[0223] In some embodiments, the cytidine deaminase or a catalytic domain thereof is any deaminase mentioned in PCT / CN2024 / 078613 or any PCT application claims the priority of PCT / CN2024 / 078613.

[0224] In some embodiments, the functional domain comprises an uracil glycosylase inhibitor (UGI) domain.

[0225] In some embodiments, the fusion protein comprises one, two, or three UGI domains.

[0226] In some embodiments, the fusion protein comprises the polypeptide, the cytidine deaminase or a catalytic domain thereof, and the UGI domain.

[0227] In some embodiments, the fusion protein comprises, from N-to C-terminus, an optional NLS, the cytidine deaminase or a catalytic domain thereof, an optional linker, the polypeptide, an optional linker, the UGI domain, an optional linker, optionally the UGI domain, an optional linker, and an optional NLS.

[0228] (ii) Prime editor

[0229] In some embodiments, the functional domain comprises a reverse transcriptase or a catalytic domain thereof.

[0230] In some embodiments, the fusion protein comprises the polypeptide and the reverse transcriptase or a catalytic domain thereof.

[0231] In some embodiments, the fusion protein comprises, from N-to C-terminus, an optional NLS, the polypeptide, an optional linker, the reverse transcriptase or a catalytic domain thereof, an optional linker, an optional NLS, an optional linker, and an optional NLS.

[0232] (iii) Epigenomic editor

[0233] In some aspects, the disclosure provides a way to epigenomic modification of a target gene, e.g., methylation, to regulate the gene. The epigenomic modification, in some embodiments, silences the expression of the gene, leading to reduced level of a corresponding mRNA and / or reduced level of a corresponding protein.

[0234] In some embodiments, the fusion protein comprises a transcription inhibiting domain (e.g., KRAB domain or SID domain) .

[0235] In some embodiments, the fusion protein comprises a KRAB domain.

[0236] In some embodiments, the fusion protein comprises a DNA methyltransferase, such as, DNMT3l, DNMT3a.

[0237] In some embodiments, the fusion protein comprises a DNMT3l domain and a DNMT3a domain.

[0238] In some embodiments, the fusion protein comprises the polypeptide, a DNMT3l domain, a DNMT3a domain, and a KRAB domain.

[0239] In some embodiments, the fusion protein comprises, from N-terminal to C-terminal, the polypeptide, the KRAB domain, the DNMT3l domain, and the DNMT3a domain.

[0240] (iv) Transcriptional Activator

[0241] In some aspects, the disclosure provides a way to transcriptional regulation of a target gene, for example, by transcriptional activation or inhibition of the promoter under the regulation of which the target gene is. The transcriptional regulation, in some embodiments, increase or decreases the expression of the target gene, leading to an increased or decreased level of a corresponding mRNA and / or an increased or decreased level of a corresponding protein.

[0242] In some embodiments, the functional domain comprises a transcription activating domain (e.g., VP64, VPR, or miniVPR) .

[0243] In some embodiments, the fusion protein comprises the polypeptide of the disclosure and the transcription activating domain.

[0244] In some embodiments, the fusion protein comprises, from N-terminal to C-terminal, the polypeptide, and the transcription activating domain.

[0245] In some embodiments, the transcription activating domain comprises miniVPR.

[0246] In some embodiments, the miniVPR comprises an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, or 100%) to SEQ ID NO: 39. In some embodiments, the miniVPR comprises, consists essentially of, or consists of the amino acid sequence of SEQ ID NO: 39. In some embodiments, the miniVPR comprises, consists essentially of, or consists of the amino acid sequence of SEQ ID NO: 39 provided that the amino acid residue Aps (D) at position 4 of SEQ ID NO: 39 is substituted with Arg (R) .

[0247] In some embodiments, the transcription activating domain comprises an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, or 100%) to SEQ ID NO: 39. In some embodiments, the transcription activating domain comprises, consists essentially of, or consists of the amino acid sequence of SEQ ID NO: 39. In some embodiments, the transcription activating domain comprises, consists essentially of, or consists of the amino acid sequence of SEQ ID NO: 39 provided that the amino acid residue Aps (D) at position 4 of SEQ ID NO: 39 is substituted with Arg (R) .

[0248] In some embodiments, the fusion protein comprises, consists essentially of, or consists of an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100%) to the amino acid sequence of SEQ ID NO: 40.

[0249] In some embodiments, the fusion protein comprises, consists essentially of, or consists of an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100%) to the amino acid sequence of SEQ ID NO: 40 provided that the polypeptide (dSN018) in SEQ ID NO: 40 is replaced with any other polypeptide of the disclosure.

[0250] III. Representative systems

[0251] The polypeptide (including the fusion protein) of the disclosure is used in combination with a guide nucleic acid as described herein to constitute a system comprising the polypeptide and the guide nucleic acid. The system in the disclosure is non-naturally occurring as it requires a guide sequence targeting to a target dsDNA heterologous to the scaffold sequence.

[0252] In an aspect, the disclosure provides a system comprising:

[0253] (1) the polypeptide of the disclosure, or a polynucleotide (e.g., a DNA, an RNA) encoding the polypeptide, and

[0254] (2) a guide nucleic acid or a polynucleotide (e.g., a DNA, an RNA) encoding the guide nucleic acid, the guide nucleic acid comprising:

[0255] (i) a scaffold sequence capable of forming a complex with the polypeptide; and

[0256] (ii) a guide sequence capable of hybridizing to a target sequence of a target DNA, thereby guiding the complex to the target DNA.

[0257] In some embodiments, the system is a complex comprising the polypeptide complexed with the guide nucleic acid.

[0258] In some embodiments, the complex further comprises the target DNA hybridized with the guide sequence.

[0259] In some embodiments, the system is a composition comprising the component (1) and the component (2) .

[0260] In some embodiments, the scaffold sequence is 5’ to the guide sequence.

[0261] In some embodiments, the guide nucleic acid is a guide RNA (gRNA) .

[0262] In yet another aspect, the disclosure provides a guide nucleic acid as described in the system of the disclosure.

[0263] (i) Scaffold sequence

[0264] For the purpose of the disclosure, the scaffold sequence is compatible with the polypeptide of the disclosure and is capable of complexing with the polypeptide. The scaffold sequence may be a naturally occurring scaffold sequence identified along with the polypeptide, or a variant thereof maintaining the ability to complex with the polypeptide. Generally, the ability to complex with the polypeptide is maintained as long as the secondary structure of the variant is substantially identical to the secondary structure of the naturally occurring scaffold sequence. A nucleotide deletion, insertion, or substitution in the primary sequence of the scaffold sequence may not necessarily change the secondary structure of the scaffold sequence (e.g., the relative locations and / or sizes of the stems, bulges, and loops of the scaffold sequence do not significantly deviate from that of the original stems, bulges, and loops) . For example, the nucleotide deletion, insertion, or substitution may be in a bulge or loop region of the scaffold sequence so that the overall symmetry of the bulge and hence the secondary structure remains largely the same. The nucleotide deletion, insertion, or substitution may also be in the stems of the scaffold sequence so that the lengths of the stems do not significantly deviate from that of the original stems (e.g., adding or deleting one base pair in each of two stems correspond to 4 total base changes) . On the other hand, engineering of the scaffold sequence may be applied to improve the activity of the system.

[0265] In some embodiments, the scaffold sequence has substantially the same secondary structure as the secondary structure of any one of SEQ ID NOs: 36 and 19-35.

[0266] In some embodiments, the scaffold sequence comprises a polynucleotide sequence having a sequence identity of at least about 80% (e.g., at least about 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, or 100%) to any one of SEQ ID NOs: 36 and 19-35.

[0267] In some embodiments, the scaffold sequence comprises the polynucleotide sequence of any one of SEQ ID NOs: 36 and 19-35.

[0268] In the disclosure, referring to the correspondence relationship as shown in Table 1, for any polypeptide of the disclosure based on SEQ ID NO: 1 (e.g., SEQ ID NO: 1 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 19 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 2 (e.g., SEQ ID NO: 2 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 20 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 3 (e.g., SEQ ID NO: 3 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 21 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 4 (e.g., SEQ ID NO: 4 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 22 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 5 (e.g., SEQ ID NO: 5 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 23 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 6 (e.g., SEQ ID NO: 6 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 24 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 7 (e.g., SEQ ID NO: 7 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 25 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 8 (e.g., SEQ ID NO: 8 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 26 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 9 (e.g., SEQ ID NO: 9 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 27 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 10 (e.g., SEQ ID NO: 10 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 28 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 11 (e.g., SEQ ID NO: 11 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 29 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 12 (e.g., SEQ ID NO: 12 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 30 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 13 (e.g., SEQ ID NO: 13 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 31 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 14 (e.g., SEQ ID NO: 14 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 32 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 15 (e.g., SEQ ID NO: 15 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 33 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 16 (e.g., SEQ ID NO: 16 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 34 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 17 (e.g., SEQ ID NO: 17 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 35 or a derivative thereof; for any polypeptide of the disclosure based on SEQ ID NO: 18 (e.g., SEQ ID NO: 18 per se or a derivative thereof, the corresponding scaffold sequence is SEQ ID NO: 36 or a derivative thereof.

[0269] In some embodiments, the polypeptide comprises SEQ ID NO: 1 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 19 or a derivative thereof in the disclosure.

[0270] In some embodiments, the polypeptide comprises SEQ ID NO: 2 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 20 or a derivative thereof in the disclosure.

[0271] In some embodiments, the polypeptide comprises SEQ ID NO: 3 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 21 or a derivative thereof in the disclosure.

[0272] In some embodiments, the polypeptide comprises SEQ ID NO: 4 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 22 or a derivative thereof in the disclosure.

[0273] In some embodiments, the polypeptide comprises SEQ ID NO: 5 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 23 or a derivative thereof in the disclosure.

[0274] In some embodiments, the polypeptide comprises SEQ ID NO: 6 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 24 or a derivative thereof in the disclosure.

[0275] In some embodiments, the polypeptide comprises SEQ ID NO: 7 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 25 or a derivative thereof in the disclosure.

[0276] In some embodiments, the polypeptide comprises SEQ ID NO: 8 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 26 or a derivative thereof in the disclosure.

[0277] In some embodiments, the polypeptide comprises SEQ ID NO: 9 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 27 or a derivative thereof in the disclosure.

[0278] In some embodiments, the polypeptide comprises SEQ ID NO: 10 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 28 or a derivative thereof in the disclosure.

[0279] In some embodiments, the polypeptide comprises SEQ ID NO: 11 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 29 or a derivative thereof in the disclosure.

[0280] In some embodiments, the polypeptide comprises SEQ ID NO: 12 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 30 or a derivative thereof in the disclosure.

[0281] In some embodiments, the polypeptide comprises SEQ ID NO: 13 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 31 or a derivative thereof in the disclosure.

[0282] In some embodiments, the polypeptide comprises SEQ ID NO: 14 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 32 or a derivative thereof in the disclosure.

[0283] In some embodiments, the polypeptide comprises SEQ ID NO: 15 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 33 or a derivative thereof in the disclosure.

[0284] In some embodiments, the polypeptide comprises SEQ ID NO: 16 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 34 or a derivative thereof in the disclosure.

[0285] In some embodiments, the polypeptide comprises SEQ ID NO: 17 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 35 or a derivative thereof in the disclosure.

[0286] In some embodiments, the polypeptide comprises SEQ ID NO: 18 or a derivative thereof in the disclosure, and the scaffold sequence comprises SEQ ID NO: 36 or a derivative thereof in the disclosure.

[0287] As used herein, the term “derivative” in connection with the scaffold sequence of the disclosure refers to a mutant of the scaffold sequence in which a nucleotide addition, deletion, or substation is introduced.

[0288] (ii) Protospacer sequence  / target sequence

[0289] In some embodiments, the protospacer sequence comprises about or at least about 14 contiguous nucleotides of the target DNA, e.g., about or at least about 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, or more contiguous nucleotides of the target DNA, or in a numerical range between any two of the preceding values, e.g., from about 14 to about 50, or from about 19 to about 24 contiguous nucleotides of the target DNA. In some embodiments, the protospacer sequence comprises about 20 contiguous nucleotides of the target DNA. As used herein, in the context of a target dsDNA, the protospacer sequence is on the nontarget strand of the target dsDNA.

[0290] In some embodiments, the protospacer sequence is immediately 3’ to a protospacer adjacent motif (PAM) . In some embodiments, the PAM comprises, consists essentially of, or consists of 5’-TTN-3’ , wherein N is A, T, G, or C.

[0291] In some embodiments, the target sequence comprises about or at least about 14 contiguous nucleotides of the target DNA, e.g., about or at least about 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, or more contiguous nucleotides of the target DNA, or in a numerical range between any two of the preceding values, e.g., from about 14 to about 50, or from about 19 to about 24 contiguous nucleotides of the target DNA. In some embodiments, the target sequence comprises about 20 contiguous nucleotides of the target DNA. As used herein, in the context of a target dsDNA, the target sequence is on the target strand of the target dsDNA.

[0292] (iii) Guide sequence

[0293] In some embodiments, the guide sequence is about or at least about 14 nucleotides in length, e.g., about or at least about 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, or more nucleotides in length, or in a length of a numerical range between any two of the preceding values, e.g., in a length of from about 14 to about 50 nucleotides, or from about 19 to about 24 nucleotides. In some embodiments, the guide sequence is about 20 nucleotides in length.

[0294] In some embodiments, (1) the guide sequence is at least about 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, or 100% (fully) reverse complementary to the target sequence; (2) the guide sequence contains no more than 5, 4, 3, 2, or 1 mismatch or contains no mismatch with the target sequence; or (3) the guide sequence comprises no mismatch with the target sequence in the first 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, or 70 nucleotides at the 5’ end of the guide sequence. In some embodiments, (1) the guide sequence is about 100% (fully) reverse complementary to the target sequence.

[0295] In some embodiments, the system comprises one guide nuclei acid comprising two or more guide sequences capable of hybridizing to two or more target sequences of the same target DNA or different target DNAs, wherein the two or more guide sequences are the same or different, and wherein the two or more target sequences are the same or different.

[0296] In some embodiments, the system comprises two or more guide nuclei acids comprising two or more guide sequences capable of hybridizing to two or more target sequences of the same target DNA or different target DNAs, wherein the two or more guide sequences are the same or different, and wherein the two or more target sequences are the same or different.

[0297] (iv) Target DNA

[0298] In some embodiments, the target DNA is a target dsDNA, such as, a eukaryotic dsDNA, e.g., a gene in a eukaryotic cell.

[0299] IV. Polynucleotides

[0300] In yet another aspect, the disclosure provides a polynucleotide comprising a sequence encoding the polypeptide of the disclosure. In some embodiments, the polynucleotide further comprises a sequence encoding a guide nucleic acid as described in the disclosure or further comprises a guide nucleic acid as described in the disclosure.

[0301] In yet another aspect, the disclosure provides a polynucleotide encoding or comprising a sequence encoding a guide nucleic acid as described in the disclosure.

[0302] (i) Regulation of guide nucleic acid

[0303] In some embodiments, the polynucleotide encoding or comprising a sequence encoding the guide nucleic acid is a DNA, a RNA, or a DNA / RNA mixture. By “DNA / RNA mixture” it refers to a nucleic acid comprising both one or more modified or unmodified ribonucleotides and one or more modified or unmodified deoxyribonucleotides, whether consecutive or not. However, by “DNA” or “RNA” it may also refer to a DNA containing one or more modified or unmodified ribonucleotides, whether consecutive or not, or an RNA containing one or more modified or unmodified deoxyribonucleotides, whether consecutive or not.

[0304] In some embodiments, the guide nucleic acid is operably linked to or under the regulation of a promoter.

[0305] In some embodiments, the promoter is a ubiquitous, tissue-specific, cell-type specific, constitutive, or inducible promoter.

[0306] Suitable promoters are known in the art and include, for example, a Cbh promoter, a Cba promoter, a pol I promoter, a pol II promoter, a pol III promoter, a T7 promoter, a U6 promoter, a H1 promoter, a retroviral Rous sarcoma virus LTR promoter, a cytomegalovirus (CMV) promoter, a SV40 promoter, a dihydrofolate reductase promoter, a β-actin promoter, an elongation factor 1α short (EFS) promoter, a βglucuronidase (GUSB) promoter, a cytomegalovirus (CMV) immediate-early (Ie) enhancer and / or promoter, a chicken β-actin (CBA) promoter or derivative thereof such as a CAG promoter, CB promoter, a (human) elongation factor 1α-subunit (EF1α) promoter, a ubiquitin C (UBC) promoter, a prion promoter, a neuron-specific enolase (NSE) , a neurofilament light (NFL) promoter, a neurofilament heavy (NFH) promoter, a platelet-derived growth factor (PDGF) promoter, a platelet-derived growth factor B-chain (PDGF-β) promoter, a synapsin (Syn) promoter, a synapsin 1 (Syn1) promoter, a methyl-CpG binding protein 2 (MeCP2) promoter, a Ca2+ / calmodulin-dependent protein kinase II (CaMKII) promoter, a metabotropic glutamate receptor 2 (mGluR2) promoter, a neurofilament light (NFL) promoter, a neurofilament heavy (NFH) promoter, a β-globin minigene nβ2 promoter, a preproenkephalin (PPE) promoter, an enkephalin (Enk) promoter, an excitatory amino acid transporter 2 (EAAT2) promoter, a glial fibrillary acidic protein (GFAP) promoter, and a myelin basic protein (MBP) promoter.

[0307] (ii) Regulation of polypeptide

[0308] In some embodiments, the polynucleotide comprising a sequence encoding the polypeptide is a DNA, a RNA, or a DNA / RNA mixture.

[0309] In some embodiments, the polynucleotide comprising a sequence encoding the polypeptide is operably linked to or under the regulation of a promoter.

[0310] In some embodiments, the promoter is a ubiquitous, tissue-specific, cell-type specific, constitutive, or inducible promoter.

[0311] Suitable promoters are known in the art and include, for example, a Cbh promoter, a Cba promoter, a pol I promoter, a pol II promoter, a pol III promoter, a T7 promoter, a U6 promoter, a H1 promoter, a retroviral Rous sarcoma virus LTR promoter, a cytomegalovirus (CMV) promoter, a SV40 promoter, a dihydrofolate reductase promoter, a β-actin promoter, an elongation factor 1α short (EFS) promoter, a βglucuronidase (GUSB) promoter, a cytomegalovirus (CMV) immediate-early (Ie) enhancer and / or promoter, a chicken β-actin (CBA) promoter or derivative thereof such as a CAG promoter, CB promoter, a (human) elongation factor 1α-subunit (EF1α) promoter, a ubiquitin C (UBC) promoter, a prion promoter, a neuron-specific enolase (NSE) , a neurofilament light (NFL) promoter, a neurofilament heavy (NFH) promoter, a platelet-derived growth factor (PDGF) promoter, a platelet-derived growth factor B-chain (PDGF-β) promoter, a synapsin (Syn) promoter, a human synapsin (hSyn) promoter, a synapsin 1 (Syn1) promoter, a methyl-CpG binding protein 2 (MeCP2) promoter, a Ca2+ / calmodulin-dependent protein kinase II (CaMKII) promoter, a metabotropic glutamate receptor 2 (mGluR2) promoter, a neurofilament light (NFL) promoter, a neurofilament heavy (NFH) promoter, a β-globin minigene nβ2 promoter, a preproenkephalin (PPE) promoter, an enkephalin (Enk) promoter, an excitatory amino acid transporter 2 (EAAT2) promoter, a glial fibrillary acidic protein (GFAP) promoter, a myelin basic protein (MBP) promoter, a OTOF promoter, a GRK1 promoter, a CRX promoter, a NRL promoter, a MECP2 promoter, a mMECP2 promoter, a hMECP2 promoter, an APP promoter, and a RCVRN promoter.

[0312] V. Delivery

[0313] Various ways of delivery can be applied to the polypeptide of the disclosure or the system of the disclosure as needed in practices.

[0314] In yet another aspect, the disclosure provides a delivery system comprising (1) the polypeptide of the disclosure, the polynucleotide of the disclosure, or the system of the disclosure; and (2) a delivery vehicle.

[0315] In yet another aspect, the disclosure provides a vector comprising the polynucleotide of the disclosure. In some embodiments, the vector is a plasmid vector, a viral vector (e.g., a recombinant AAV (rAAV) vector, a recombinant lentivirus vector) , a ribonucleoprotein (RNP) , or a lipid nanoparticle (LNP) .

[0316] In yet another aspect, the disclosure provides a recombinant AAV (rAAV) particle comprising the rAAV vector of the disclosure. In some embodiments, the rAAV vector is an RNA. A simple introduction of AAV for delivery may refer to “Adeno-associated Virus (AAV) Guide” (addgene. org / guides / aav / ) .

[0317] Adeno-associated virus (AAV) , when engineered to delivery, e.g., a protein-encoding sequence of interest, may be termed as a (r) AAV vector, a (r) AAV vector particle, or a (r) AAV particle, where “r” stands for “recombinant” . And the nucleic acid packaged in AAV vectors for delivery may be termed as a (r) AAV vector genome, vector genome, or vg for short, while viral genome may refer to the original viral genome of natural AAVs.

[0318] The serotypes of the capsids of rAAV particles can be matched to the types of target cells. For example, Table 2 of WO2018002719A1 lists exemplary cell types that can be transduced by the indicated AAV serotypes (incorporated herein by reference) .

[0319] In some embodiments, the rAAV particle comprises a capsid with a serotype suitable for delivery into target cells (e.g., inner hair cells) . In some embodiments, the rAAV particle comprising a capsid with a serotype of AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAVrh74, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, or AAV. PHP. eB, a member of the Clade to which any of the AAV1-AAV13 belong, or a functional variant (e.g., a functional truncation) thereof, encapsidating the rAAV vector. In some embodiments, the serotype of the capsid is AAV9 or a functional variant thereof.

[0320] General principles of rAAV particle production are known in the art. In some embodiments, rAAV particles may be produced using the triple transfection method (described in detail in U.S. Pat. No. 6,001,650) .

[0321] The vector titers are usually expressed as vector genomes per ml (vg / ml) . In some embodiments, the vector titer is above 1×109, above 5×1010, above 1×1011, above 5×1011, above 1×1012, above 5×1012, or above 1×1013 vg / ml.

[0322] Instead of packaging a single strand (ss) DNA as a vector genome of a rAAV particle, systems and methods of packaging an RNA as a vector genome into a rAAV particle is recently developed and applicable herein. See PCT / CN2022 / 075366, which is incorporated herein by reference in its entirety.

[0323] When the vector genome is RNA as in, for example, PCT / CN2022 / 075366, for simplicity of description and claiming, sequence elements described herein for DNA vector genomes, when present in RNA vector genomes, should generally be considered to be applicable for the RNA vector genomes except that the deoxyribonucleotides in the DNA sequence are the corresponding ribonucleotides in the RNA sequence (e.g., dT is equivalent to U, and dA is equivalent to A) and / or the element in the DNA sequence is replaced with the corresponding element with a corresponding function in the RNA sequence or omitted because its function is unnecessary in the RNA sequence and / or an additional element necessary for the RNA vector genome is introduced.

[0324] As used herein, a coding sequence, e.g., as a sequence element of rAAV vector genomes herein, is construed, understood, and considered as covering and covers both a DNA coding sequence and an RNA coding sequence. When it is a DNA coding sequence, an RNA sequence can be transcribed from the DNA coding sequence, and optionally further a protein can be translated from the transcribed RNA sequence as necessary. When it is an RNA coding sequence, the RNA coding sequence per se can be a functional RNA sequence for use, or an RNA sequence can be produced from the RNA coding sequence, e.g., by RNA processing, or a protein can be translated from the RNA coding sequence.

[0325] For example, a polynucleotide encoding a polypeptide covers either a DNA from which the polypeptide is expressed (indirectly via transcription and translation) or an RNA from which a polypeptide is translated (directly) .

[0326] For example, a nucleic acid comprising or encoding a gRNA covers either a DNA from which a gRNA is transcribed or an RNA (1) which per se functions in the same way as the gRNA is, or (2) from which a gRNA is produced, e.g., by RNA processing.

[0327] In some embodiments for rAAV RNA vector genomes, 5’-ITR and / or 3’-ITR as DNA packaging signals may be unnecessary and can be omitted at least partly, while RNA packaging signals can be introduced. In some embodiments for rAAV RNA vector genomes, a promoter to drive transcription of DNA sequences may be unnecessary and can be omitted at least partly. In some embodiments for rAAV RNA vector genomes, a sequence encoding a polyA signal may be unnecessary and can be omitted at least partly, while a polyA tail can be introduced. Similarly, other DNA elements of rAAV DNA vector genomes can be either omitted or replaced with corresponding RNA elements and / or additional RNA elements can be introduced, in order to adapt to the strategy of delivering an RNA vector genome by rAAV particles.

[0328] In yet another aspect, the disclosure provides a ribonucleoprotein (RNP) comprising the polypeptide of the disclosure and the guide nucleic acid as described in the disclosure.

[0329] In yet another aspect, the disclosure provides a lipid nanoparticle (LNP) comprising (1) an RNA (e.g., mRNA) comprising a sequence encoding the polypeptide of the disclosure and (2) a guide nucleic acid as described in the disclosure.

[0330] In yet another aspect, the disclosure provides a cell comprising the polypeptide of the disclosure, the system of the disclosure, the polynucleotide of the disclosure, the vector of the disclosure, the rAAV particle of the disclosure, the RNP of the disclosure, or the LNP of the disclosure.

[0331] VI. Method of modifying

[0332] The polypeptide and system of the disclosure have a wide variety of utilities, including modifying (e.g., base editing, transcriptional activation or inactivation, methylation or demethylation) a target DNA in a multiplicity of cell types. The system has a broad spectrum of applications requiring high activity  / efficiency and small sizes, e.g., establishing animal models, cell engineering, prevention, diagnosis, and treatment of diseases.

[0333] The polypeptide and system of the disclosure can be used to modify a target DNA, for example, to modify the transcription of one or more genes in a target cell. For example, the modification may lead to increased or decreased transcription of a gene.

[0334] In yet another aspect, the disclosure provides a method for modifying a target DNA, comprising contacting the target DNA with the system of the disclosure, the vector of the disclosure, the ribonucleoprotein of the disclosure, or the lipid nanoparticle of the disclosure, wherein the guide sequence is capable of hybridizing to a target sequence of the target DNA, wherein the target DNA is modified by the complex.

[0335] In some embodiments, the modification includes base editing (e.g., single base editing) , prime editing, epigenomic editing, including transcriptional activation or inhibition.

[0336] In some embodiments, the method is in vitro, in vivo, or ex vivo.

[0337] In some embodiments, the target DNA is in a cell.

[0338] In yet another aspect, the disclosure provides a cell modified by the system of the disclosure or the method of the disclosure. In some embodiments, the cell is modified in vitro, in vivo, or ex vivo.

[0339] In some embodiments, the cell is a eukaryotic cell (e.g., an animal cell, a vertebrate cell, a mammalian cell, a non-human mammalian cell, a non-human primate cell, a rodent (e.g., mouse or rat) cell, a human cell, a plant cell, or a yeast cell) or a prokaryotic cell (e.g., a bacteria cell) .

[0340] In some embodiments, the cell is from a plant or an animal. In some embodiments, the cell is not from a plant.

[0341] In some embodiments, the cell is a non-human mammalian cell, such as a cell from a non-human primate (e.g., monkey) , an ox  / cow  / bull  / cattle, sheep, goat, pig, horse, dog, cat, rodent (such as rabbit, mouse, rat, hamster, etc. ) , alpaca. In some embodiments, the cell is from fish (such as salmon, zebra fish) , bird (such as poultry bird, including chick, duck, goose) , reptile, shellfish (e.g., oyster, clam, lobster, shrimp) , insect, worm, yeast, etc.

[0342] In some embodiments, the plant is a dicotyledon. In some embodiments, the dicotyledon is selected from the group consisting of soybean, cabbage (e.g., Chinese cabbage) , rapeseed, brassica, watermelon, melon, potato, tomato, tobacco, eggplant, pepper, cucumber, cotton, alfalfa, eggplant, grape. In some embodiments, the plant is a monocotyledon. In some embodiments, the monocotyledon is selected from the group consisting of rice, corn, wheat, barley, oat, sorghum, millet, grasses, Poaceae, Zizania, Avena, Coix, Hordeum, Oryza, Panicum (e.g., Panicum miliaceum) , Secale, Setaria (e.g., Setaria italica) , Sorghum, Triticum, Zea, Cymbopogon, Saccharum (e.g., Saccharum officinarum) , Phyllostachys, Dendrocalamus, Bambusa, Yushania.

[0343] In some embodiments, the cell is from a plant, such as monocot or dicot. In certain embodiment, the plant is a food crop such as barley, cassava, cotton, groundnuts or peanuts, maize, millet, oil palm fruit, potatoes, pulses, rapeseed or canola, rice, rye, sorghum, soybeans, sugar cane, sugar beets, sunflower, and wheat. In certain embodiment, the plant is a cereal (barley, maize, millet, rice, rye, sorghum, and wheat) . In certain embodiment, the plant is a tuber (cassava and potatoes) . In certain embodiment, the plant is a sugar crop (sugar beets and sugar cane) . In certain embodiment, the plant is an oil-bearing crop (soybeans, groundnuts or peanuts, rapeseed or canola, sunflower, and oil palm fruit) . In certain embodiment, the plant is a fiber crop (cotton) . In certain embodiment, the plant is a tree (such as a peach or a nectarine tree, an apple or pear tree, a nut tree such as almond or walnut or pistachio tree, or a citrus tree, e.g., orange, grapefruit or lemon tree) , a grass, a vegetable, a fruit, or an algae. In certain embodiment, the plant is a nightshade plant; a plant of the genus Brassica; a plant of the genus Lactuca; a plant of the genus Spinacia; a plant of the genus Capsicum; cotton, tobacco, asparagus, carrot, cabbage, broccoli, cauliflower, tomato, eggplant, pepper, lettuce, spinach, strawberry, blueberry, raspberry, blackberry, grape, coffee, cocoa, etc.

[0344] In some embodiments, the cell is a stem cell. In some embodiments, the cell is an embryonic stem cell. In some embodiments, the cell is a primary human cell or an established human cell line.

[0345] In some embodiments, the cell is not a human or animal embryonic stem cell. In some embodiments, the cell is not a human or animal germ cell. In some embodiments, the cell is not a plant cell.

[0346] Further embodiments are illustrated in the following Examples which are given for illustrative purposes only and are not intended to limit the scope of the disclosure.

[0347] EXAMPLES

[0348] The following examples are provided to further illustrate some embodiments of the disclosure but are not intended to limit the scope of the invention; it will be understood by their exemplary nature that other procedures, methodologies, or techniques known to those skilled in the art may alternatively be used.

[0349] EXAMPLE 1. Transcriptional activators developed based on the guide nucleic acid-guided DNA binding proteins of the disclosure

[0350] Design:

[0351] Deactivated ( “dead” ) mutants of the guide nucleic acid-guided DNA binding proteins of the disclosure, SN001-SN018 (SEQ ID NOs: 1-18, respectively) were developed by introducing two mutations as shown in Table 2 below to deactivate potential endonuclease activity, if any, for safety purpose. As an example, dSN018 (or SN018-D320A, E473A) refers to the deactivated mutant of SN018 (SEQ ID NO: 18) , in which both original residues Asp (D) and Glu (E) at positions 320 and 473 were substituted with residues Alanine (A) . It was later tested that the removal of the two mutations did not affect DNA binding and transcriptional activation, and therefore the two mutations are not essential for the purpose of transcriptional activation.

[0352] Transcriptional activators were developed by linking each deactivated mutant to a transcription activating domain, named miniaturized VPR (miniVPR) (SEQ ID NO: 39) , together with NLS and linkers. The deactivated mutants serve as DNA binding domains guided by a guide RNA to a target dsDNA so as to complex with and indirectly bind to the target dsDNA to form a protein-guide nucleic acid-dsDNA complex such that the transcription activating domain linked to the DNA binding domain can approach to and function on the target dsDNA.

[0353] As an example, the full-length amino acid sequence of the transcriptional activator comprising dSN018 is set forth in SEQ ID NO: 40, which is designated as “dSN018-miniVPR” . Specifically, dSN018-miniVPR is consisting of, from N-terminal to C-terminal, Methionine (encoded by start codon ATG) , a flag, sv40NLS, dSN018 (SN018-D320A, E473A) , nucleoplasmin NLS, HA-tag, a linker, miniVPR (SEQ ID NO:39) , a linker, and cmyNLS. The full-length amino acid sequences of the other transcriptional activators with respect to dSN001-dSN017 and dMmCas12m (as a control) can be obtained by merely replacing dSN018 with each indicated deactivated mutant. The amino acid sequence of MmCas12m is set forth in SEQ ID NO: 37, and the scaffold sequence of the corresponding gRNA is set forth in SEQ ID NO: 38.

[0354] dSN018-miniVPR (SEQ ID NO: 40)

[0355]

[0356] A dual-fluorescence reporter plasmid was designed to test the transcription activating efficiency of each of the eighteen (18) transcriptional activators and a control activator comprising dMmCas12m. The reporter plasmid comprises a sequence encoding EGFP under the regulation of TRE3G promoter containing tet operator, and a sequence encoding mCherry under the regulation of minimal CMV promoter.

[0357] An expression plasmid was designed to express the transcriptional activator in eukaryotic cells, comprising, from 5’ to 3’ , CMV enhancer, chicken β-actin promoter, a sequence encoding the transcriptional activator, and bGH poly (A) signal; and a sequence encoding BFP under the regulation of CMV promoter.

[0358] A gRNA plasmid was designed to express the gRNA in eukaryotic cells, comprising a sequence encoding a first gRNA (e.g., SEQ ID NO: 42) targeting tet operator in the TRE3G promoter of the reporter plasmid and a second gRNA (e.g., SEQ ID NO: 44) targeting CMV promoter of the reporter plasmid under the regulation of U6 promoter; and a sequence encoding BFP under the regulation of CMV promoter.

[0359] The first gRNA (e.g., SEQ ID NO: 42) is consisting of (1) a scaffold sequence (e.g., SEQ ID NO: 36) corresponding to the deactivated mutant (e.g., dSN018) comprised in the transcriptional activator (e.g., SEQ ID NO: 40) for combinational use and (2) a guide sequence (SEQ ID NO: 41) targeting tet operator 3 and 3’ to the scaffold sequence. As an example, the gRNA for use in combination with the transcriptional activator comprising dSN018 is set forth in SEQ ID NO: 42, consisting of scaffold sequence as set forth in SEQ ID NO: 36 corresponding to dSN018 as described in Table 1 and guide sequence as set forth in SEQ ID NO: 41 3’ to scaffold sequence. The gRNA for use in combination with the other transcriptional activators can be obtained by merely replacing the scaffold sequence of SEQ ID NO:36 in the gRNA of SEQ ID NO: 42 with the scaffold sequence (e.g., SEQ ID NOs: 19-35 and 38) corresponding to each other deactivated mutant comprised in the other transcriptional activators as described in Table 1.

[0360] The second gRNA (e.g., SEQ ID NO: 44) is consisting of (1) a scaffold sequence (e.g., SEQ ID NO: 36) corresponding to the deactivated mutant (e.g., dSN018) comprised in the transcriptional activator (e.g., SEQ ID NO: 40) for combinational use and (2) a guide sequence (SEQ ID NO: 43) targeting CMV promoter and 3’ to the scaffold sequence. As an example, the gRNA for use in combination with the transcriptional activator comprising dSN018 is set forth in SEQ ID NO: 44, consisting of scaffold sequence as set forth in SEQ ID NO: 36 corresponding to dSN018 as described in Table 1 and guide sequence as set forth in SEQ ID NO: 43 3’ to scaffold sequence. The gRNA for use in combination with the other transcriptional activators can be obtained by merely replacing the scaffold sequence of SEQ ID NO:36 in the gRNA of SEQ ID NO: 44 with the scaffold sequence (e.g., SEQ ID NOs: 19-35 and 38) corresponding to each other deactivated mutant comprised in the other transcriptional activators as described in Table 1.

[0361] The dual-fluorescence reporter plasmid, the expression plasmid, and the gRNA plasmid were co-transfected into HEK293 cells to test the transcription activating efficiency of each transcriptional activator. The reporter plasmid contained both EGFP fluorescent reporter system and mCherry fluorescent reporter system. In the case that the transcriptional activator is guided by the gRNA to tet operator, EGFR fluorescent signal will be enhanced. In the case that the transcriptional activator is guided by the gRNA to CMV promoter, mCherry fluorescent signal will be enhanced. The transcription activating efficiency was quantified by the percentage of cells with fluorescence among the whole transfected cells or by mean fluorescence intensity, unless otherwise indicated. NT refers to a negative control with dSN018 and a non-targeting gRNA.

[0362] Methods

[0363] Mammalian cell culture, transfection, and flow cytometry analysis

[0364] The mammalian cell lines used in this study were HEK293T and N2A. Cells were cultured in Dulbecco’s modified Eagle’s medium (DMEM) supplemented with 10%FBS, 1%Penicillin-Streptomycin-Glutamine (100×) and 1%MEM nonessential amino acids (100×) in a humidified incubator maintained at 37 ℃ with 5%CO2. Transfections were performed using polyetherimide (PEI) . For variant screening, cells were seeded on 24-well plates and cultured until reaching approximately 70%confluence over 12 hours. Then 2 μg of the plasmids, including 1 μg of mutant Cas protein plasmid, 0.5 μg of guide RNA plasmid, and 0.5 μg of reporter plasmid, were co-transfected into the cells with 4ul of PEI. After 48hrs, EGFP and mCherry fluorescence intensity were analyzed by BD FACSAria II flow cytometer. The activation activities were calculated as the percentage proportion of EGFP positive and / or mCherry cells in BFP positive cells, or EGFP and / or mCherry mean fluorescence Intensity.

[0365] Activation efficiency analysis at human or mouse endogenous genomic loci

[0366] For analyzing the activation efficiencies of endogenous genes, HEK293T cells were transfected with 1.5μg of expression plasmids and 3 μl of PEI, while N2A cells were transfected with 2μg of expression plasmids and 4 μl of PEI. After 48hrs, cells were collected for RNA extraction with RNA-easy Isolation Reagent according to the manufacturer protocol. The complementary DNAs were reverse transcribed using HiScript IV RT SuperMix for qPCR (+gDNA wiper) (Vazyme) . To quantify and compare the expression level of target sites, quantitative PCR (qPCR) was performed with AceQ qPCR SYBR Green Master Mix (Vazyme) on Roche 480 II. The qPCR results were analyzed with the -ΔΔCT method.

[0367] Table 2.

[0368] Results:

[0369] Referring to Table 2, most of the transcriptional activators exhibited increased transcription activating efficiency than the negative control, confirming that those binding proteins are suitable for carrying functional domains, such as, a transcription activating domain like miniVPR, to a target dsDNA. Particularly, dSN018-miniVPR exhibited the most significant transcription activating efficiency, suggesting the best performance of SN018 than any other.

[0370] EXAMPLE 2. Protein engineering of dSN018

[0371] Design:

[0372] Mutants of dSN018 were developed by introducing one amino acid substitution as shown in Table 3 (n=1) below in order to develop improved transcriptional activators, which improvement shall be attributed to the substitution since no other change was made to the transcriptional activators.

[0373] Table 3

[0374] Further testing (n=3) was conducted for certain positions of SN018 (SEQ ID NO: 18) as shown in Table 4 (n=1) below.

[0375] Table 4

[0376] WT refers to testing with SN018 (SEQ ID NO: 18) and a targeting gRNA. NT refers to testing with SN018 (SEQ ID NO: 18) and a non-targeting gRNA.

[0377] Results:

[0378] Referring to Tables 3 and 4, the single substitutions T17R, L26R, L27R, P30R, S34R, A42R, C55R, Q59R, A60R, E67R, D87R, A91R, Q94R, G95R, A112R, A132R, L155R, I184R, F212R, Q217R, G219R, A227R, Q280R, H289R, I355R, E367R, T368R, D370R, K371R, V375R, I397R, F409R, W410R, V422R, Y425R, E428R, T429R, H432R, H462R, D489R, P496R, E507R, Q552R, S557R, L558R, W568R, A572R, N579R, A586R, K601R, K602R, K603R, A604R, P606R, T607R, S608R, S609R, H613R, D614R, E615R, S618R, P619R, T620R, G621R, and S622R lead to improved transcription activating efficiency for both EGFP reporter system and mCherry reporter system.

[0379] EXAMPLE 3. Further protein engineering of dSN018

[0380] Design:

[0381] Further mutants of dSN018 were developed by combining two or more amino acid substitutions in Example 2 as shown in Tables 4 and 5 (n=3) below in order to develop improved transcriptional activators, which improvement shall be attributed to the combinational substitution since no other change was made to the transcriptional activators.

[0382] Table 5

[0383] Table 6

[0384] Results:

[0385] Referring to Tables 5 and 6, all the indicated combinational substitutions lead to improved transcription activating efficiency for both EGFP reporter system and mCherry reporter system. The mutant SN018-C55R, I184R was designated as “v1” . The mutant SN018-C55R, I184R, G219R, H289R, P496R, E507R was designated as “v2” . The mutant SN018-C55R, I184R, G219R, H289R, P496R, E507R, V422R was designated as “v3” or “denSN018” , and the transcriptional activator comprising denSN018 was designated as “denSN018-miniVPR” .

[0386] EXAMPLE 4. Testing on endogenous gene sites

[0387] Design:

[0388] Mutants v1, v2, and v3 were tested on endogenous HBB and HBG gene sites as shown in Tables 7 and 8 (n=3) below in order to verify the transcriptional activating ability of the transcriptional activators.

[0389] Table 7

[0390] The guide sequences for Table 7 are

[0391] HBB1: gacctcaccctgtggagcca (SEQ ID NO: 45)

[0392] HBG1: ttcttcatccctagccagccgcc (SEQ ID NO: 46)

[0393] The gRNA for Table 7 is:

[0394] Scaffold-HBB1-Scaffold-HBG1-Scaffold:

[0395] CTCACAAGAGAAGCTCAGATCTTTGGGTTCTGAGACgacctcaccctgtggagccaCTCACAAGAGAAGCTCAGATCTTTGGGTTCTGAGACttcttcatccctagccagccgccCTCACAAGAGAAGCTCAGATCTTTGGGTTCTGAGAC(SEQ ID NO: 47)

[0396] Table 8

[0397] The guide sequences for Table 8 are

[0398] HBB1: gacctcaccctgtggagcca (SEQ ID NO: 45)

[0399] HBB2: ggagttggacttcaaaccct (SEQ ID NO: 48)

[0400] HBB3: ccaagctgtgattccaaata (SEQ ID NO: 49)

[0401] For HBB1, HBB2, and HBB3 in Table 8, the gRNA contains a single scaffold sequence and a single guide sequence as indicated.

[0402] For HBB123 in Table 8, the gRNA targets all HBB1, HBB2, and HBB3 and is Scaffold-HBB1-Scaffold-HBB2-Scaffold-HBB3-Scaffold:

[0403] CTCACAAGAGAAGCTCAGATCTTTGGGTTCTGAGACgacctcaccctgtggagccaCTCACAAGAGAAGCTCAG ATCTTTGGGTTCTGAGACggagttggacttcaaaccctCTCACAAGAGAAGCTCAGATCTTTGGGTTCTGAGACccaagctgtgattccaaataCTCACAAGAGAAGCTCAGATCTTTGGGTTCTGAGAC (SEQ ID NO: 50)

[0404] Results:

[0405] Referring to Tables 7 and 8, all the transcriptional activators comprising DNA binding protein v1, v2, or v3 achieved significant endogenous gene transcriptional activation. More importantly, the transcriptional activation of two separate genes HBB and HBG1 in Table 7 were achieved by using one gRNA molecule containing two guide sequences targeting the two genes; and the transcriptional activation of the same gene HBB was remarkably enhanced by using one gRNA molecule containing three different guide sequences target separate domains of the promoter of the same gene.

[0406] EXAMPLE 5. Improvement on miniVPR

[0407] Design:

[0408] A single substitution D4R (numbered according to SEQ ID NO: 39) was introduced into miniVPR of denSN018-miniVPR in order to develop an improved transcriptional activator, which improvement shall be attributed to the substitution since no other change was made to the transcriptional activator. The gRNAs for Table 9 are the same as in Example 4.

[0409] Table 9 (n=3)

[0410] Table 10 (n=3)

[0411] Results:

[0412] Referring to Tables 9 and 10, the D4R substitution introduced into miniVPR leads to significantly improved transcriptional activation. The resulting transcriptional activator was designated as “denSN018-enminiVPR” .

[0413] ***

[0414] Various modifications and variations of the described products, methods, and uses of the disclosure will be apparent to those skilled in the art without departing from the scope and spirit of the disclosure. Although the disclosure has been described in connection with specific embodiments, it will be understood that it is capable of further modifications and that the disclosure as claimed should not be unduly limited to such specific embodiments. Indeed, various modifications of the described modes for carrying out the disclosure that are obvious to those skilled in the art are intended to be within the scope of the disclosure. This application is intended to cover any variations, uses, or adaptations of the disclosure following, in general, the principles of the disclosure and including such departures from the present disclosure come within known customary practice within the art to which the disclosure pertains and may be applied to the essential features herein before set forth.

Claims

1.A polypeptide comprising an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, or 100%) to the amino acid sequence of any one of SEQ ID NOs: 18 and 1-17.2.The polypeptide of any preceding claim, wherein the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position selected from the group consisting of 17, 26, 27, 30, 34, 42, 55, 59, 60, 67, 87, 91, 94, 95, 112, 132, 155, 184, 212, 217, 219, 227, 280, 289, 355, 367, 368, 370, 371, 375, 397, 409, 410, 422, 425, 428, 429, 432, 462, 489, 496, 507, 552, 557, 558, 568, 572, 579, 586, 601, 602, 603, 604, 606, 607, 608, 609, 613, 614, 615, 618, 619, 620, 621, and 622 of SEQ ID NO: 18; optionally, the amino acid substitution is an amino acid substitution with Arginine (R) .3.The polypeptide of any preceding claim, wherein the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position selected from the group consisting of 55, 60, 67, 87, 91, 94, 95, 184, 219, 289, 355, 367, 368, 370, 375, 397, 422, 425, 428, 429, 462, 489, 496, and 507 of SEQ ID NO: 18; optionally, the amino acid substitution is an amino acid substitution with Arginine (R) .4.The polypeptide of any preceding claim, wherein the polypeptide comprises an amino acid substitution selected from the group consisting of:(1) C55R;(2) A60R;(3) E67R;(4) D87R;(5) A91R;(6) Q94R;(7) G95R;(8) I184R;(9) G219R;(10) H289R;(11) I355R;(12) E367R;(13) T368R;(14) D370R;(15) V375R;(16) I397R;(17) V422R;(18) Y425R;(19) E428R;(20) T429R;(21) H462R;(22) D489R;(23) P496R;(24) E507R;(25) C55R + I184R ( “v1” ) ;(26) C55R + I184R + G219R;(27) C55R + I184R + H289R;(28) C55R + I184R + G219R + H289R;(29) C55R + I184R + P496R;(30) C55R + I184R + E507R;(31) C55R + I184R + P496R + E507R;(32) C55R + I184R + G219R + H289R + P496R;(33) C55R + I184R + G219R + H289R + P496R + E507R ( “v2” ) ;(34) C55R + I184R + G219R + H289R + P496R + E507R + A60R;(35) C55R + I184R + G219R + H289R + P496R + E507R + E67R;(36) C55R + I184R + G219R + H289R + P496R + E507R + D87R;(37) C55R + I184R + G219R + H289R + P496R + E507R + A91R;(38) C55R + I184R + G219R + H289R + P496R + E507R + Q94R;(39) C55R + I184R + G219R + H289R + P496R + E507R + G95R;(40) C55R + I184R + G219R + H289R + P496R + E507R + I355R;(41) C55R + I184R + G219R + H289R + P496R + E507R + E367R;(42) C55R + I184R + G219R + H289R + P496R + E507R + T368R;(43) C55R + I184R + G219R + H289R + P496R + E507R + D370R;(44) C55R + I184R + G219R + H289R + P496R + E507R + V375R;(45) C55R + I184R + G219R + H289R + P496R + E507R + E428R;(46) C55R + I184R + G219R + H289R + P496R + E507R + I397R;(47) C55R + I184R + G219R + H289R + P496R + E507R + V422R ( “v3” ) ;(48) C55R + I184R + G219R + H289R + P496R + E507R + Y425R;(49) C55R + I184R + G219R + H289R + P496R + E507R + T429R;(50) C55R + I184R + G219R + H289R + P496R + E507R + H462R;(51) C55R + I184R + G219R + H289R + P496R + E507R + D489R; andany combination of (1) - (51) ;relative to SEQ ID NO: 18.5.The polypeptide of any preceding claim, wherein the polypeptide comprises an amino acid substitution at a position of any one of SEQ ID NOs: 18 and 1-17 that is corresponding to a position selected from the group consisting of D320 and E473 of SEQ ID NO: 18, for example, the positions of SEQ ID NO: 7 corresponding to the positions of D320 and E473 of SEQ ID NO: 18 are positions D300 and E453 of SEQ ID NO: 7, respectively; optionally, the amino acid substitution is an amino acid substitution with a non-polar amino acid residue, such as, Alanine (A) .6.The polypeptide of any preceding claim, wherein the polypeptide comprises amino acid substitutions of (a) C55R + I184R + G219R + H289R + P496R + E507R + V422R, relative to SEQ ID NO: 18; or (b) C55R + I184R + G219R + H289R + P496R + E507R + V422R + D320A + E473A, relative to SEQ ID NO:18.7.A fusion protein comprising the polypeptide of any preceding claim and a functional domain.8.The fusion protein of any preceding claim, wherein the functional domain is selected from the group consisting of a nuclear localization signal (NLS) , a nuclear export signal (NES) , a deaminase or a catalytic domain thereof, an uracil glycosylase inhibitor (UGI) , an uracil glycosylase (UNG) , a methylpurine glycosylase (MPG) , a methylase or a catalytic domain thereof, a demethylase or a catalytic domain thereof, an transcription activating domain (e.g., VP64, VPR, miniVPR) , an transcription inhibiting domain (e.g., KRAB moiety or SID moiety) , a reverse transcriptase or a catalytic domain thereof, an exonuclease or a catalytic domain thereof (e.g., T5 exonuclease) , a histone residue modification domain, a nuclease catalytic domain (e.g., FokI) , a transcription modification factor, a light gating factor, a chemical inducible factor, a chromatin visualization factor, a targeting polypeptide for providing binding to a cell surface portion on a target cell or a target cell type, a reporter (e.g., fluorescent) polypeptide or a detection label (e.g., GST, HRP, CAT, GFP, HcRed, DsRed, CFP, YFP, BFP) , a localization signal, a polypeptide targeting moiety, a DNA binding domain (e.g., MBP, Lex A DBD, Gal4 DBD) , an epitope tag (e.g., His, myc, V5, FLAG, HA, VSV-G, Trx, etc) , a transcription release factor, an HDAC, a moiety having RNA cleavage activity, a moiety having ssDNA cleavage activity, a moiety having dsDNA cleavage activity, a DNA or RNA ligase, a functional domain exhibiting activity to modify a target DNA selected from the group consisting of: methyltransferase activity, DNA repair activity, DNA damage activity, dismutase activity, alkylation activity, dealkylation activity, depurination activity, oxidation activity, deoxidation activity, pyrimidine dimer forming activity, integrase activity, transposase activity, recombinase activity, polymerase activity, ligase activity, helicase activity, photolyase activity, glycosylase activity, acetyl transferase activity, deacetylase activity, kinase activity, phosphatase activity, ubiquitin ligase activity, deubiquitination activity, adenylation activity, deadenylation activity, SUMOylation activity, deSUMOylation activity, ribosylation activity, deribosylation activity, myristoylation activity, demyristoylation activity, glycosylation activity (e.g., from O-GlcNAc transferase) , deglycosylation activity, and a catalytic domain thereof, and a functional fragment thereof, and any combination thereof.9.The fusion protein of any preceding claim, wherein the transcription activating domain comprises an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, or 100%) to SEQ ID NO: 39; optionally, wherein the transcription activating domain comprises the amino acid sequence of SEQ ID NO: 39, and optionally, the amino acid residue Aps (D) at position 4 of SEQ ID NO: 39 is substituted with Arg (R) .10.The fusion protein of any preceding claim, wherein the fusion protein comprises, consists essentially of, or consists of an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100%) to the amino acid sequence of SEQ ID NO: 40; or wherein the fusion protein comprises, consists essentially of, or consists of an amino acid sequence having a sequence identity of at least about 80% (e.g., at least about 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100%) to the amino acid sequence of SEQ ID NO: 40 provided that the polypeptide in SEQ ID NO: 40 is replaced with the polypeptide of any preceding claim other than dSN018.11.A system comprising:(1) the polypeptide of any preceding claim or the fusion protein of any preceding claim, or a polynucleotide (e.g., a DNA, an RNA) encoding the polypeptide or the fusion protein, and(2) a guide nucleic acid or a polynucleotide (e.g., a DNA, an RNA) encoding the guide nucleic acid, the guide nucleic acid comprising:(i) a scaffold sequence capable of forming a complex with the polypeptide or the fusion protein; and(ii) a guide sequence capable of hybridizing to a target sequence of a target DNA, thereby guiding the complex to the target DNA.12.The system of any preceding claim, wherein the scaffold sequence has substantially the same secondary structure as the secondary structure of any one of SEQ ID NOs: 36 and 19-35; or the scaffold sequence comprises a polynucleotide sequence having a sequence identity of at least about 80% (e.g., at least about 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, or 100%) to any one of SEQ ID NOs: 36 and 19-35; or the scaffold sequence comprises the polynucleotide sequence of any one of SEQ ID NOs: 36 and 19-35.13.The system of any preceding claim, wherein the guide sequence is in a length of from about 19 to about 24 nucleotides; optionally, the guide sequence is about 20 nucleotides in length.14.A polynucleotide comprising a sequence encoding the polypeptide of any preceding claim or the fusion protein of any preceding claim.15.A vector comprising the polynucleotide of any preceding claim; optionally, the vector is a plasmid vector, a viral vector (e.g., a recombinant AAV (rAAV) vector, a recombinant lentivirus vector) , a ribonucleoprotein (RNP) , or a lipid nanoparticle (LNP) .16.A cell comprising the polypeptide of any preceding claim, the fusion protein of any preceding claim, the system of any preceding claim, the polynucleotide of any preceding claim, or the vector of any preceding claim.17.A method for modifying a target DNA, comprising contacting the target DNA with the system of any preceding claim, wherein the guide sequence is capable of hybridizing to a target sequence of the target DNA, wherein the target DNA is modified by the complex.