Difference between revisions of "Task 4: Homology based structure predictions"

Revision as of 22:19, 12 June 2011

Task description

The full description of this task can be found here.

In this task we are going to learn more about several methods of homology modelling. There exists only a small number of known protein structures. Therefore if someone wants to predict the structure of a somehow new protein (newly sequenced, a mutant, etc.). He could use known structures to calculate a model of the unknown structure.

Homology modelling bases on an alignment between the target-sequence and one or more template structures. The aligned coordinates are directly used for the model. That is why it is important to select a good template and alignment.

Calculation of models

Overview of available homologous structures

Search

We used hhsearch with the standard parameter to find homologous structures of our protein. The following command was executed:

./hhsearch -i reference_pah_aa.fasta -d pdb70.db -b 500 -o hhsearch.out

We received the following hits:

No.	PDB ID	Description	Prob	E-Value	P-Value	Score	Cols	Query HMM	Template HMM	Residues	Sequence Identity
1	1phz_A	Protein (phenylalanine	1	1	1	1084.4	429	1-429	1-429	(429)	92%
2	1j8u_A	Phenylalanine-4-hydroxy	1	1	1	894.5	325	103-427	1-325	(325)	100%
3	1toh_A	Tyroh tyrosine hydroxy	1	1	1	890.7	342	111-452	2-343	(343)	60%
4	1mlw_A	Tryptophan 5-monooxygen	1	1	1	804.2	300	116-415	2-301	(301)	66%
5	1ltz_A	Phenylalanine-4-hydroxy	1	1	1	504.9	265	144-414	2-269	(297)	30%
6	2v27_A	Phenylalanine hydroxyla	1	1	1	471.1	254	167-424	4-271	(275)	30%
7	2qmx_A	Prephenate dehydratase;	1	1	1	70.0	53	33-85	199-251	(283)	40%
8	2qmw_A	PDT prephenate dehydra	1	1	1	66.1	51	35-85	190-240	(267)	37%
9	3luy_A	Probable chorismate mut	1	1	1	66.0	53	33-85	207-259	(329)	28%
10	1y7p_A	Hypothetical protein AF	1	1	1	19.9	38	36-73	6-43	(223)	16%

Template structure selection

We selected the following structures as our template structures:

> 60% sequence identity: 1phz
> 40% sequence identity: 1toh
< 40% sequence identity: 1ltz

Alignment Refinement

We used the reference for a search in PFAM. There were two PFAM-domains detected on the reference sequence: ACT and Biopterin_H Then we used the sequence of the three proteins 1PHZ, 1TOH and 1LTZ to run a search against PFAM and used the alignments with the HMMs of ACT and Biopterin_H and the alignment of the reference sequence with the HMMs of ACT and Biopterin_H as seeds for the improved alignments. The crucial parts of the reference sequence according to the annotation in UniProt was already aligned by the seeds. We predicted the secondary structure of the three sequences of the proteins (TODO ref... seems to be better to predict) and tried to extend the seeds. In PHZ a large gap could be filled by high sequence identity. Afterwards we deleted the unaligned ends of the reference sequence to improve the resulting model. The essential part of the protein, the domains, should now be better modeled.

Seeds by PFAM - ACT:



REFERENCE

SLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKkDEYEFFTHLD-KRSL


1PHZ

SLIFSLKEEVGALAKVLRLFEENDINLTHIESRPSRLNkDEYEFFTYL------

Seeds by PFAM - Biopterin_H



REFERENCE

PWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYK

THACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPE

PDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPD-EYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCL-S

EKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSE

IGILCSALQK



1PHZ

PWFPRTIQELDRFANQI------LDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYTEEEKQTWGTVFRTLKALYK

THACYEHNHIFPLLEKYCGFREDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPE

PDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPD-EYIEKLATIYWFTVEFGLCKEGDSIKAYGAGLLSSFGELQYCL-S

DKPKLLPLELEKTACQEYSVTEFQPLYYVAESFSDAKEKVRTFAATIPRPFSVRYDPYTQRVEVLDNT-------------

----------



1TOH

PWFPRKVSELDKC-----------DLDHPGFSDQVYRQRRKLIAEIAFQYKHGEPIPHVEYTAEEIATWKEVYVTLKGLYA

THACREHLEGFQLLERYCGYREDSIPQLEDVSRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPE

PDCCHELLGHVPMLADRTFAQFSQDIGLASLGASD-EEIEKLSTVYWFTVEFGLCKQNGELKAYGAGLLSSYGELLHSL-S

EEPEVRAFDPDTAAVQPYQDQTYQPVYFVSESFNDAKDKLRNYASRIQRPFSVKFDPYTLAIDVLDSPHTIQRSLEGVQDE

LHTLAHALS-



1LTZ

------------------------------------------------------PQPLDRYSAEDHATWATLYQRQCKLLP

GRACDEFLEGLERLEV----DADRVPDFNKLNEKLMAATGWKIVAVPGLIPDDVFFEHLANRRFPVTWWLREPHQLDYLQE

PDVFHDLFGHVPLLINPVFADYLEAYGKGGVKAKAlGALPMLARLYWYTVEFGLINTPAGMRIYGAGILSSKSESIYCLdS

ASPNRVGFDLMRIMNTRYRIDTFQKTYFVIDSFKQ----------------------------------------------

----------

unadjusted alignment of 1PHZ



REFERENCE

MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFF

THLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQ

FADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGF

RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEK

LATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVR

NFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK



PSI

CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEECCCCCHHHHHHHHHHHHCCCCEEEEECCCCCCCCCCEEEE

EECCCCCCHHHHHHHHHHCCCCEEEECCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHH

HHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCC

EEEECCCCCCHHHHHHHCCCCEECCCEEEECCCCCCCCCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCHHHHHH

HHHHEEEEEEEEEECCCCCEEEECCCCCCCHHHHHHHHCCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHHHH

HHHHHCCCCCEEEECCCCCEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHC



1PHZ

------------------GQETSYIEDNSNQNGAISLIFSLKEEVGALAKVLRLFEENDINLTHIESRPSRLNKDEYEFF

TYLDKRTKPVLGSIIKSLRNDIGATVHELSRDKEKNTVPWFPRTIQELDRFANQI------LDADHPGFKDPVYRARRKQ

FADIAYNYRHGQPIPRVEYTEEEKQTWGTVFRTLKALYKTHACYEHNHIFPLLEKYCGFREDNIPQLEDVSQFLQTCTGF

RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEK

LATIYWFTVEFGLCKEGDSIKAYGAGLLSSFGELQYCLSDKPKLLPLELEKTACQEYSVTEFQPLYYVAESFSDAKEKVR

TFAATIPRPFSVRYDPYTQRVEVLDNT-------------------------



PSI

------------------CCCCCCCCCCCCCCCEEEEEEEECCCCCHHHHHHHHHHHCCCEEEEEECCCCCCCCCEEEEE

EEECCCCCCCHHHHHHHHHCCCCCCEEECCCCCCCCCCCCCCCCHHHHHHHHHHH------CCCCCCCCCCHHHHHHHHH

HHHHCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHCCCC

EEEECCCCCCHHHHHHHHHCCCCCEECCCCCCCCCCCCCCCCHHHHHCCCCCCCCCHHHHHHHHHHHHHHCCCCHHHHHH

HHHHEEEEEEEEEEEECCCCEEECCCCCCCCCCCCCCCCCCCCCCCCCHHHHHCCCCCCCCCCCCEEEECCHHHHHHHHH

HHHHHCCCCCCCCCCCCCCEEEECCCC-------------------------

unadjusted alignment of 1TOH



REFERENCE

MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFF

THLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQ

FADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGF

RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEK

LATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVR

NFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK



PSI

CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEECCCCCHHHHHHHHHHHHCCCCEEEEECCCCCCCCCCEEEE

EECCCCCCHHHHHHHHHHCCCCEEEECCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHH

HHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCC

EEEECCCCCCHHHHHHHCCCCEECCCEEEECCCCCCCCCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCHHHHHH

HHHHEEEEEEEEEECCCCCEEEECCCCCCCHHHHHHHHCCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHHHH

HHHHHCCCCCEEEECCCCCEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHC



1PHZ

------------------GQETSYIEDNSNQNGAISLIFSLKEEVGALAKVLRLFEENDINLTHIESRPSRLNKDEYEFF

TYLDKRTKPVLGSIIKSLRNDIGATVHELSRDKEKNTVPWFPRTIQELDRFANQI------LDADHPGFKDPVYRARRKQ

FADIAYNYRHGQPIPRVEYTEEEKQTWGTVFRTLKALYKTHACYEHNHIFPLLEKYCGFREDNIPQLEDVSQFLQTCTGF

RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEK

LATIYWFTVEFGLCKEGDSIKAYGAGLLSSFGELQYCLSDKPKLLPLELEKTACQEYSVTEFQPLYYVAESFSDAKEKVR

TFAATIPRPFSVRYDPYTQRVEVLDNT-------------------------



PSI

------------------CCCCCCCCCCCCCCCEEEEEEEECCCCCHHHHHHHHHHHCCCEEEEEECCCCCCCCCEEEEE

EEECCCCCCCHHHHHHHHHCCCCCCEEECCCCCCCCCCCCCCCCHHHHHHHHHHH------CCCCCCCCCCHHHHHHHHH

HHHHCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHCCCC

EEEECCCCCCHHHHHHHHHCCCCCEECCCCCCCCCCCCCCCCHHHHHCCCCCCCCCHHHHHHHHHHHHHHCCCCHHHHHH

HHHHEEEEEEEEEEEECCCCEEECCCCCCCCCCCCCCCCCCCCCCCCCHHHHHCCCCCCCCCCCCEEEECCHHHHHHHHH

HHHHHCCCCCCCCCCCCCCEEEECCCC-------------------------

unadjusted alignment of 1LTZ



REFERENCE

MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFF

THLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQ

FADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGF

RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPD-EYIE

KLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCL-SEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEK

VRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK



PSI

CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEECCCCCHHHHHHHHHHHHCCCCEEEEECCCCCCCCCCEEEE

EECCCCCCHHHHHHHHHHCCCCEEEECCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHH

HHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCC

EEEECCCCCCHHHHHHHCCCCEECCCEEEECCCCCCCCCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCH HHHH

HHHHHEEEEEEEEEECCCCCEEEECCCCCCCHHHHHHHH CCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHH

HHHHHHHCCCCCEEEECCCCCEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHC



1LTZ

-----------------F--------------------------V-----V-----------------------------

PDITT-----RKNVG-----LSHDANDFTLP------QPLDR-------YSA--------------------

EDHATWATLYQRQCKLLPGRACDEFLEGLERLE----VDADRVPDFNKLNEKLMAATGW

KIVAVPGLIPDDVFFEHLANRRFPVTWWLREPHQLDYLQEPDVFHDLFGHVPLLINPVFADYLEAYGKGGVKAKALGALP

MLARLYWYTVEFGLINTPAGMRIYGAGILSSKSESIYCLDSASPNRVGFDLMRIMNTRYRIDTFQKTYFVIDSFKQL---

---FDAD----FAPLY------LQLAD-AQPWG--AGDIAP------DDL--VL



PSI

-----------------C--------------------------C-----C-----------------------------

CCCCC-----CCCCC-----CCCCCCCCCCC------CCCCC-------CCH--------------------

HHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHCC----CCCCCCCCCHHHHHHHHHHHCC

EEEECCCCCCHHHHHHHHHCCCCCEEECCCCCCCCCCCCCCCHHHHHCCCCCCCCCHHHHHHHHHHHHHHCCCCCCCHHH

HHHHHHEEEEEEEEEECCCCEEEECCCCCCCCCCCCCCCCCCCCEEECCCHHHHHCCCCCCCCCCCCEEEECCHHHH---

---HHHC----CHHHH------HHHHH-CCCCC--CCCCCC------CCC--CC

adjusted alignment of 1LTZ



REFERENCE

PIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSR

DFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFG

LCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAAT



PSI

CCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCCEEEECCCCCCHH

HHHHHCCCCEECCCEEEECCCCCCCCCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHEEEEEEEE

EECCCCCEEEECCCCCCCHHHHHHHHCCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHHHHHHHHH



1LTZ

PQPLDRYSAEDHATWATLYQRQCKLLPGRACDEFLEGLERLEV----DADRVPDFNKLNEKLMAATGWKIVAVPGLIPDD

VFFEHLANRRFPVTWWLREPHQLDYLQEPDVFHDLFGHVPLLINPVFADYLEAYGKGGVKAKAlGALPMLARLYWYTVEF

GLINTPAGMRIYGAGILSSKSESIYCLdSASPNRVGFDLMRIMNTRYRIDTFQKTYFVIDSFKQLFDADFAPL



PSI

CCCCCCCCHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHCCEEEECCCCCCHHHHHH

HHHCCCCCEEECCCCCCCCCCCCCCCHHHHHCCCCCCCCCHHHHHHHHHHHHHHCCCCCCCHHHHHHHHHEEEEEEEEEE

CCCCEEEECCCCCCCCCCCCCCCCCCCCEEECCCHHHHHCCCCCCCCCCCCEEEECCHHHHHHHCCHHHHHHH

adjusted alignment of 1PHZ



REFERENCE

GQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKIL

RHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVE

YMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGL

AFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGD

SIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYT

QRIEVLDNTQQ



PSI

CCCCCCCCCCCCCCCCEEEEEECCCCCHHHHHHHHHHHHCCCCEEEEECCCCCCCCCCEEEEEECCCCCCHHHHHHHHHH

CCCCEEEECCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHCCCCCCCCCCCC

CCHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCCEEEECCCCCCHHHHHHHC

CCCEECCCEEEECCCCCCCCCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHEEEEEEEEEECCCC

CEEEECCCCCCCHHHHHHHHCCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHHHHHHHHHCCCCCEEEECCCC

CEEEECCCHHH



1PHZ

GQETSYIEDNSNQNGAISLIFSLKEEVGALAKVLRLFEENDINLTHIESRPSRLNkDEYEFFTYLDKRTKPVLGSIIKSL

RNDIGATVHELSRDKEKNTVPWFPRTIQELDRFANQI------LDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVE

YTEEEKQTWGTVFRTLKALYKTHACYEHNHIFPLLEKYCGFREDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGL

AFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPD-EYIEKLATIYWFTVEFGLCKEG

DSIKAYGAGLLSSFGELQYCL-SDKPKLLPLELEKTACQEYSVTEFQPLYYVAESFSDAKEKVRTFAATIPRPFSVRYDP

YTQRVEVLDNT



PSI

CCCCCCCCCCCCCCCEEEEEEEECCCCCHHHHHHHHHHHCCCEEEEEECCCCCCCCCEEEEEEEECCCCCCCHHHHHHHH

HCCCCCCEEECCCCCCCCCCCCCCCCHHHHHHHHHHH------CCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCCCC

CCHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHCCCCEEEECCCCCCHHHHHHHH

HCCCCCEECCCCCCCCCCCCCCCCHHHHHCCCCCCCCCHHHHHHHHHHHHHHCCCCH-HHHHHHHHHEEEEEEEEEEEEC

CCCEEECCCCCCCCCCCCCCC-CCCCCCCCCCHHHHHCCCCCCCCCCCCEEEECCHHHHHHHHHHHHHHCCCCCCCCCCC

CCCEEEECCCC

adjusted alignment of 1TOH



REFERENCE

VPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSL

YKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMY

TPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYC

LSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSI

NSEIGILCSALQKIK



PSI

CCCCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHH

HCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCCEEEECCCCCCHHHHHHHCCCCEECCCEEEECCCCCCC

CCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHEEEEEEEEEECCCCCEEEECCCCCCCHHHHHHH

HCCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHHHHHHHHHCCCCCEEEECCCCCEEEECCCHHHHHHHHHHH

HHHHHHHHHHHHHHC



1TOH

VPWFPRKVSELDKC-----------DLDHPGFSDQVYRQRRKLIAEIAFQYKHGEPIPHVEYTAEEIATWKEVYVTLKGL

YATHACREHLEGFQLLERYCGYREDSIPQLEDVSRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMH

SPEPDCCHELLGHVPMLADRTFAQFSQDIGLASLGASD-EEIEKLSTVYWFTVEFGLCKQNGELKAYGAGLLSSYGELLH

SL-SEEPEVRAFDPDTAAVQPYQDQTYQPVYFVSESFNDAKDKLRNYASRIQRPFSVKFDPYTLAIDVLDSPHTIQRSLE

GVQDELHTLAHALSA



PSI

CCCCCCCCCCCCCC-----------CCCCCCCCHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCHHHHHHHHHHHHHHHHH

HHHCCCHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHCCCEEEECCCCCCHHHHHHHHHCCCCCCCCCCCCCCCCCC

CCCCCHHHHHHCCCCCCCCHHHHHHHHHHHHHHCCCCHHHHHHHHCEEEEEEEEEEEEECCCCEECCCCCCCCCCHHCCC

CCCCCCCCCCCHHHHHCCCCCCCCCCCEEEEECCHHHHHHHHHHHHHHHCCCCCCCCCCCCCCEECCCCHHHHHHHHHHH

HHHHHHHHHHHHHHC

Homology modelling with Modeller

Modeller uses three files. The first one contains the used alignment in the PIR-format (see PIR FORMAT). This file should at least contain the sequence of the target, the actual alignment can be calculated by Modeller or specified in this file. The second one is a python script, which tells Modeller which steps it has to perform. There are some examples in /apps/modeller9.9/examples/automodel. And the third file is the pdb-file of the used template. But python seems to be falsely configured on the virtual machines (at least the linux virtual machine with the non-sudo user).

The used fix of the python installation is described at the software section.
The Modeller modules were still not importable by Python, that is why it was necessary to reinstall Modeller. The steps for this are described in software section.

We have chosen the second option, which is nicely described in the Modeller tutorial (see basic modeller tutorial).

We prepared three files for the modeling with one template(e.g. for 1PHZ).

The alignment file, which contains only the reference sequence: pah.ali
>P1;PAH sequence:reference:::::::: MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEEN DVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKD TVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPI PRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQ FLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGH VPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLL SSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATI PRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK*

We splitted the python script to modify the alignment file, which was created by Modeller in the first part of the script and used by the second part of the script.

The python script, which tells Modeller to create an alignment
from modeller import * env = environ() aln = alignment(env) mdl = model(env, file='../structures/1phz.pdb', model_segment=('FIRST:A','LAST:A')) aln.append_model(mdl, align_codes='1phz', atom_files='../structures/1phz.pdb') aln.append(file='pah.ali', align_codes='PAH') aln.align2d() aln.write(file='phz.ali', alignment_format='PIR')

The python script, which tells Modeller to create a model
from modeller.automodel import * a = automodel(env, alnfile='phz.ali', knowns='1phz', sequence='PAH', assess_methods=(assess.DOPE, assess.GA341)) a.starting_model = 1 a.ending_model = 1 a.make()

For the modeling with multiple templates we used the alignment file described above and a new script. We used the sturctures of 1MLW, 1TOH, 1PHZ as templates

from modeller import * from modeller.automodel import * env = environ() aln = alignment(env) path = '../structures/' l = (path+'1MLW'+'.pdb', path+'1TOH'+'.pdb', path+'1PHZ'+'.pdb') for (code) in l: mdl = model(env, file=code, model_segment=('FIRST:A','LAST:A')) aln.append_model(mdl, align_codes=code, atom_files=code) aln.append(file='pah.ali', align_codes='PAH') aln.align2d() aln.write(file='mult.ali', alignment_format='PIR') a = automodel(env, alnfile='mult.ali', knowns=l, sequence='PAH', assess_methods=(assess.DOPE, ssess.GA341)) a.starting_model = 1 a.ending_model = 1 a.make()

Homology modeling with Swissmodel

Standard workflow

The standard workflow of Swissmodel is the automated mode. For this mode only the UniProt accession number or the amino acid sequence of the target protein is required. As an optional parameter it is possible to enter the template structure as well. However, if this field is left blank Swissmodel will search automatically for a suitable template.

The input for all three models is as follows:

Category	Template	Target
> 60% sequence identity	1PHZ Chain: A	P00439 (Phenylalanine-4-hydroxylase)
> 40% sequence identity	1TOH Chain: A	P00439 (Phenylalanine-4-hydroxylase)
< 40% sequence identity	1LTZ Chain: A	P00439 (Phenylalanine-4-hydroxylase)

Workflow with own alignment

The workflow of Swissmodel, where you can use your own alignment, is the automated mode. For this mode the alignment has to be specified. Swissmodel accepts the alignment in different formats. We have chosen FASTA. In a new window you have to specify which FASTA id is the target and which FASTA id is the template. For the template you have to specify the corresponding pdb-id with chain. Afterwards you have to check the updated alignment with respect to the pdb structure.

The screenshots of the workflow for 1phz are shown below.

1. Specify the alignment	2. Specify target and template with structure	3. Checking of the adjusted alignment

Homology modelling with iTasser

Figure 1: screenshot of iTasser workflow with template restriction

Figure 2: screenshot of iTasser workflow with alignment and template restriction

ITasser is a prediction server, which participated in several CASP competitions. It claims of itself to be the best one. The runtime of the jobs is approximately 24 to 48 hours. The server seems to receive a lot of jobs, that is why it is not allowed to add more than one job at a time from the same ip-address. Therefore it is probably not possible to run all six variants described in the task.

iTasser offers several options. For the automated workflow we just specified a template to be used (a screenshot can be seen in figure 1). For the workflow with our adjusted alignment we specified the template with alignment (a screenshot can be seen in figure 2).

The file which was needed for the workflow with the adjusted alignment contains the alignment in FASTA format and the ATOM coordinates of the template:

>TARGET
GQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTN
IIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNY
RHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLR
PVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYI
EKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFN
DAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQ
>1phy:A
GQETSYIEDNSNQNGAISLIFSLKEEVGALAKVLRLFEENDINLTHIESRPSRLNKDEYEFFTYLDKRTKPVLGS
IIKSLRNDIGATVHELSRDKEKNTVPWFPRTIQELDRFANQI------LDADHPGFKDPVYRARRKQFADIAYNY
RHGQPIPRVEYTEEEKQTWGTVFRTLKALYKTHACYEHNHIFPLLEKYCGFREDNIPQLEDVSQFLQTCTGFRLR
PVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPD-EY
IEKLATIYWFTVEFGLCKEGDSIKAYGAGLLSSFGELQYCL-SDKPKLLPLELEKTACQEYSVTEFQPLYYVAES
FSDAKEKVRTFAATIPRPFSVRYDPYTQRVEVLDNT

ATOM      1  N   GLY A  19      40.338  -7.649  17.712  1.00117.94           N  
ATOM      2  CA  GLY A  19      40.523  -8.622  16.594  1.00119.56           C  
ATOM      3  C   GLY A  19      39.585  -8.344  15.430  1.00119.47           C  
ATOM      4  O   GLY A  19      39.005  -9.256  14.849  1.00122.09           O  
...
ATOM   3284  OG1 THR A 427      12.515  -6.231  40.981  1.00107.96           O  
 ATOM   3285  CG2 THR A 427      14.463  -5.654  39.679  1.00107.51           C  
 END

Output of iTasser:

Predicted Secondary Structure
Predicted Solvent Accessibility
5 Models with C-values
First Model with Estimated accuracy of Model1: TM-score RMSD
Top 10 templates used by I-TASSER
Ten proteins in PDB which are structurally closest to the first I-TASSER model (identified by TM-align)
Function Prediction (EC-Number, Predicted GO terms, Predicted Binding Site)

Evaluation of the calculated models

Selection of the reference structures

We had the following choice of reference structures for PAH:

Entry	Method	Resolution (A)	Chain	Positions
1DMW	X-Ray	2.00	A	118-424
1J8T	X-Ray	1.70	A	103-427
1J8U	X-Ray	1.50	A	103-427
1KW0	X-Ray	2.50	A	103-427
1LRM	X-Ray	2.10	A	103-427
1MMK	X-Ray	2.00	A	103-427
1MMT	X-Ray	2.00	A	103-427
1PAH	X-Ray	2.00	A	117-424
1TDW	X-Ray	2.10	A	117-424
1TG2	X-Ray	2.20	A	117-424
2PAH	X-Ray	3.10	A/B	118-452
3PAH	X-Ray	2.00	A	117-424
4PAH	X-Ray	2.00	A	117-424
5PAH	X-Ray	2.10	A	117-424
6PAH	X-Ray	2.15	A	117-424

All these structures have in common that they did not solve the structure of the whole PAH protein. In addition, there is no complete true apo structure available either. All structures have at least a Fe2+ atom bound. So we defined these structures as our apo structure. Finally, we decided to select 1J8T (apo) and 1J8U (complexed). As mentioned before our apo structure has complexed Fe2+ and our complexed structure is complexed with Fe2+ and BH4 (5,6,7,8-TETRAHYDROBIOPTERIN). The reason for our decision was that both structures are solved from the same group which somehow guaranties a more consistent methodology as if we had selected structures from two different groups. Another reason is the resolution, both structures are the two with the best resolved resolution which is 1.5 Angstrom and 1.7 Angstrom for 1J8U and 1J8T respectively. Finally for more easy comparison, both structures include the same range of amino acids which is from 103 to 427.

Numeric evaluation of the calculated models

Modeller

We have chosen three scores to be calculated by Modeller: molpdf, DOPE and GA341

model	modlpdf	DOPE	GA341
1phz	2568.91309	-53912.11328	1.00000
1toh	20481.25977	-37609.82031	1.00000
1ltz	6824.36182	-37422.13672	0.98868
1phz with adjusted alignment	2567.52441	-49139.31250	1.00000
1toh with adjusted alignment	1790.78723	-38113.64453	1.00000
1ltz with adjusted alignment	1197.55518	-26429.44531	1.00000
multiple alignment	61561.77344	-29682.17578	0.00012

Swissmodel

Automated Mode: Modelling with template structure 1phz_A (>60%)

QMEAN Z-Score: -0.828

QMEAN4 global scores:

QMEANscore4	Estimated absolute model quality	Score components
0.715

Local scores:

Coloring by residue error	Residue error plot

Global scores: QMEAN4:

Scoring function term	Raw score	Z-score
C_beta interaction energy	-157.98	-0.16
All-atom pairwise energy	-12503.57	-0.1
Solvation energy	-50.66	1.01
Torsion angle energy	-78.77	-1.48
QMEAN4 score	0.715	-0.83

Local Model Quality Estimation: Anolea / QMEAN / Gromos:

Automated Mode: Modelling with template structure 1toh_A (>40%)

QMEAN Z-Score: -2.745

QMEAN4 global scores:

QMEANscore4	Estimated absolute model quality	Score components
0.604

Local scores:

Coloring by residue error	Residue error plot

Global scores: QMEAN4:

Scoring function term	Raw score	Z-score
C_beta interaction energy	-78.67	-1.16
All-atom pairwise energy	-7899.47	-0.89
Solvation energy	-20.56	-1.3
Torsion angle energy	-47.34	-2.22
QMEAN4 score	0.604	-2.74

Local Model Quality Estimation: Anolea / QMEAN / Gromos:

Automated Mode: Modelling with template structure 1ltz_A (<40%)

QMEAN Z-Score: -4.282

QMEAN4 global scores:

QMEANscore4	Estimated absolute model quality	Score components
0.47

Local scores:

Coloring by residue error	Residue error plot

Global scores: QMEAN4:

Scoring function term	Raw score	Z-score
C_beta interaction energy	-40.25	-2.1
All-atom pairwise energy	-3528.81	-2.29
Solvation energy	-15.22	-1.18
Torsion angle energy	-4.99	-3.78
QMEAN4 score	0.47	-4.28

Local Model Quality Estimation: Anolea / QMEAN / Gromos:

Alignment Mode: Modeling with adjusted alignment 1phz_A (>60%)

QMEAN Z-Score: -2.786

QMEAN4 global scores:

QMEANscore4	Estimated absolute model quality	Score components
0.6

Local scores:

Coloring by residue error	Residue error plot

Global scores: QMEAN4:

Scoring function term	Raw score	Z-score
C_beta interaction energy	-87.10	-1.26
All-atom pairwise energy	-8126.09	-1.51
Solvation energy	-29.98	-0.84
Torsion angle energy	-58.30	-2.39
QMEAN4 score	0.600	-2.79

Local Model Quality Estimation: Anolea / QMEAN / Gromos:

Alignment Mode: Modeling with adjusted alignment 1toh_A (>40%)

QMEAN Z-Score: -4.498

QMEAN4 global scores:

QMEANscore4	Estimated absolute model quality	Score components
0.494

Local scores:

Coloring by residue error	Residue error plot

Global scores: QMEAN4:

Scoring function term	Raw score	Z-score
C_beta interaction energy	-21.70	-2.19
All-atom pairwise energy	-4082.14	-2.32
Solvation energy	-3.04	-3.04
Torsion angle energy	-34.43	-2.83
QMEAN4 score	0.494	-4.50

Local Model Quality Estimation: Anolea / QMEAN / Gromos:

Alignment Mode: Modeling with adjusted alignment 1ltz_A (<40%)

QMEAN Z-Score: -4.673

QMEAN4 global scores:

QMEANscore4	Estimated absolute model quality	Score components
0.447

Local scores:

Coloring by residue error	Residue error plot

Global scores: QMEAN4:

Scoring function term	Raw score	Z-score
C_beta interaction energy	-18.68	-2.69
All-atom pairwise energy	-1884.30	-2.99
Solvation energy	-9.58	-1.72
Torsion angle energy	-7.34	-3.55
QMEAN4 score	0.447	-4.67

Local Model Quality Estimation: Anolea / QMEAN / Gromos:

iTasser

Model	C-Score	estimated TM-score	estimated RMSD
1phz	0.150	0.73±0.11	6.8±4.0Å
1toh	0.074	0.72±0.11	6.9±4.1Å
1ltz	-0.380	0.66±0.13	7.9±4.4Å
1phz adjusted	1.650	0.95±0.05	3.5±2.4Å
1toh adjusted	1.944	0.99±0.04	2.6±1.9Å
1ltz adjusted

JigSaw 3D

Without a reference structure it is hard to say which predicted model is the best. There are methods and servers, which try to rank several models. If their performance would be perfect, the modeling of proteins was a solved problem. But their performance is sometimes far from perfect. One of these severs is 3D-Jigsaw. In fact 3D-Jigsaw is a complete protein modeling server, but we want just to use its ranking function.

The ranking of the models needs a lot of resources on the JigSaw server. Our goal is to select five of the six models for each group. Therefore we try to kick out models which are too similar. That is why we calculated the pairwise TMScore for the different models of one prediction class and selected only one member of a high-scoring pair.

Selection of models

1phz - sequence identity > 60 %

	modeller	modeller adjusted	swissmodel	swissmodel adjusted	iTasser	iTasser adjusted
modeller	1.0000	0.0941	0.9773	0.0933	0.8911	0.0958
modeller adjusted	0.0885	1.0000	0.0918	0.9808	0.0887	0.8141
swissmodel	0.8845	0.0915	1.0000	0.0906	0.8883	0.0942
swissmodel adjusted	0.0879	0.9808	0.0909	1.0000	0.0877	0.8181
iTasser	0.8911	0.0937	0.9815	0.0932	1.0000	0.0959
iTasser adjusted	0.0902	0.8141	0.0945	0.8181	0.0898	1.0000

The similarity between the models of modeller with adjusted alignment and swissmodel with adjusted alignment is too high. We decided to kick the model of modeller.

1toh - sequence identity > 40 %

	modeller	modeller adjusted	swissmodel	swissmodel adjusted	iTasser	iTasser adjusted
modeller	1.0000	0.0941	0.7839	0.0929	0.5782	0.0910
modeller adjusted	0.0759	1.0000	0.0928	0.9379	0.0812	0.7005
swissmodel	0.5818	0.0926	1.0000	0.0893	0.6602	0.0878
swissmodel adjusted	0.0750	0.9379	0.0895	1.0000	0.0792	0.7118
iTasser	0.5782	0.1008	0.8902	0.0980	1.0000	0.0961
iTasser adjusted	0.0733	0.7005	0.0881	0.7118	0.0779	1.0000

The similarity between the models of modeller with adjusted alignment and swissmodel with adjusted alignment is too high. We decided to kick the model of modeller.

1ltz - sequence identity < 40 %

	modeller	modeller adjusted	swissmodel	swissmodel adjusted	iTasser	iTasser adjusted
modeller	1.0000	0.0898	0.8383	0.0889	0.4521	0.0000
modeller adjusted	0.0589	1.0000	0.0661	0.9722	0.0592	0.0000
swissmodel	0.4601	0.0695	1.0000	0.0689	0.4566	0.0000
swissmodel adjusted	0.0577	0.9722	0.0656	1.0000	0.0601	0.0000
iTasser	0.4521	0.0941	0.8266	0.0951	1.0000	0.0000
iTasser adjusted

iTasser is really slow and allows just one request at a time, therefore it was not possible to calculate the model with the adjusted alignment by iTasser.

Comparison to experimental structure

To calculate the C-alpha RMSD we used DaliLite. Later we changed to the command line tool sap file1.pdb file2.pdb.

To calculate the TM-Score we used the TM-score webservice from the University of Michigan alternative. Later we changed to the command line tool TMS model.pdb native.pdb.

To calculate the RMSD of the 6A radius of the catalytic center we had to first identify the catalytic center. We defined the center position of the catalytic side as the position where our Fe2+ atom is. With the position in hand we now have to extract the residues in a 6A radius around this Fe2+ atom. In order to do so we executed the following steps:

We opened the complexed or apo structure and one of the modeled structures with Pymol.
Then we aligned both structures to each other
Then we selected the Fe2 atom of the apo/complexed structure and expanded this selection by 6A, residue
Then we extracted the selected residues into two objects each object contains only the residues of either the apo/complexed structure or the modeled structure
Then we saved both objects in seperate PDB structures
Now we used the rms.pl script to calculate the all atom RMSD with the following command "./rms.pl -out all first.pdb second.pdb". This script is already installed in /apps/bin and can be called in the commandline by rms.pl.

We had a lot of models, therefore it was useful to write a program to do the evaluation automatically (sourcecode).

Modeller

Standard Workflow

Template Structure	Compared To	Apo/Complexed	C-alpha RMSD	TM score	All Atoms RMSD, 6A
1PHZ Chain: A	1J8T	Apo	0.9	0.9711	0.276
1PHZ Chain: A	1J8U	Complexed	0.9	0.6494	0.271
1TOH Chain: A	1J8T	Apo	1.9	0.6502	0.282
1TOH Chain: A	1J8U	Complexed	1.9	0.8850	0.242
1LTZ Chain: A	1J8T	Apo	2.3	0.6986	1.638
1LTZ Chain: A	1J8U	Complexed	2.3	0.6985	1.581
Multiple	1J8T	Apo	2.1	0.1886	3.814
Multiple	1J8U	Complexed	2.1	0.1879	3.809

Adjusted Alignment Workflow

Template Structure	Compared To	Apo/Complexed	C-alpha RMSD	TM score	All Atoms RMSD, 6A
1PHZ Chain: A	1J8T	Apo	1.0	0.1957	0.298
1PHZ Chain: A	1J8U	Complexed	1.0	0.1954	0.310
1TOH Chain: A	1J8T	Apo	1,1	0.1592	0.276
1TOH Chain: A	1J8U	Complexed	1.1	0.1592	0.328
1LTZ Chain: A	1J8T	Apo	1.7	0.1021	3.562
1LTZ Chain: A	1J8U	Complexed	1.7	0.1020	0.832

Swissmodel

Standard Workflow

Template Structure	Compared To	Apo/Complexed	C-alpha RMSD	TM score	All Atoms RMSD, 6A
1PHZ Chain: A	1J8T	Apo	0.9	0.7400	0.5162
1PHZ Chain: A	1J8U	Complexed	0.9	0.7408	0.5154
1TOH Chain: A	1J8T	Apo	1.3	0.8889	0.4616
1TOH Chain: A	1J8U	Complexed	1.2	0.8894	0.3361
1LTZ Chain: A	1J8T	Apo	2.3	0.8816	0.9225
1LTZ Chain: A	1J8U	Complexed	2.3	0.8814	0.9208

Adjusted Alignment Workflow

Template Structure	Compared To	Apo/Complexed	C-alpha RMSD	TM score	All Atoms RMSD, 6A
1PHZ Chain: A	1J8T	Apo	0.645	0.0880	0.355
1PHZ Chain: A	1J8U	Complexed	0.615	0.0878	0.267
1TOH Chain: A	1J8T	Apo	0.996	0.0894	0.227
1TOH Chain: A	1J8U	Complexed	0.993	0.0894	0.262
1LTZ Chain: A	1J8T	Apo	1.542	0.0782	1.204
1LTZ Chain: A	1J8U	Complexed	1.542	0.0790	3.839

iTasser

Standard Workflow

Template Structure	Compared To	Apo/Complexed	C-alpha RMSD	TM score	All Atoms RMSD, 6A
1PHZ Chain: A	1J8T	Apo	0.722	0.6596	0.241
1PHZ Chain: A	1J8U	Complexed	0.698	0.6604	0.279
1TOH Chain: A	1J8T	Apo	0.749	0.6571	0.299
1TOH Chain: A	1J8U	Complexed	0.731	0.6578	0.297
1LTZ Chain: A	1J8T	Apo	0.644	0.6606	0.374
1LTZ Chain: A	1J8U	Complexed	0.610	0.6620	0.351

Adjusted Alignment Workflow

Template Structure	Compared To	Apo/Complexed	C-alpha RMSD	TM score	All Atoms RMSD, 6A
1PHZ Chain: A	1J8T	Apo	0.829	0.0903	0.424
1PHZ Chain: A	1J8U	Complexed	0.816	0.0909	0.441
1TOH Chain: A	1J8T	Apo	0.720	0.0875	0.449
1TOH Chain: A	1J8U	Complexed	0.671	0.0873	0.416
1LTZ Chain: A	1J8T	Apo
1LTZ Chain: A	1J8U	Complexed

@@ Line 1,147: / Line 1,147: @@
 === JigSaw 3D ===
-Without a reference structure it is hard to say which predicted model is the best. There are methods and servers, which try to rank several models. If their performance would be perfect, the modeling of proteins was a solved problem. But their performance is sometimes far from perfect. One of these severs is JigSaw-3D.
+Without a reference structure it is hard to say which predicted model is the best. There are methods and servers, which try to rank several models. If their performance would be perfect, the modeling of proteins was a solved problem. But their performance is sometimes far from perfect. One of these severs is [http://bmm.cancerresearchuk.org/~populus/populus_submit.html 3D-Jigsaw]. In fact 3D-Jigsaw is a complete protein modeling server, but we want just to use its ranking function.
-The ranking of the models needs a lot of resources of the JigSaw server. But the chosen models should not be too similar, that is why we calculated the pairwise TMScore for the different models of one prediction class and selected only one member of a high-scoring pair. Our goal is to select five of the six models for each group.
+The ranking of the models needs a lot of resources on the JigSaw server. Our goal is to select five of the six models for each group. Therefore we try to kick out models which are too similar. That is why we calculated the pairwise TMScore for the different models of one prediction class and selected only one member of a high-scoring pair.
 ====Selection of models====

REFERENCE	SLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKkDEYEFFTHLD-KRSL
1PHZ	SLIFSLKEEVGALAKVLRLFEENDINLTHIESRPSRLNkDEYEFFTYL------

REFERENCE	PWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYK THACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPE PDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPD-EYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCL-S EKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSE IGILCSALQK
1PHZ	PWFPRTIQELDRFANQI------LDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYTEEEKQTWGTVFRTLKALYK THACYEHNHIFPLLEKYCGFREDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPE PDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPD-EYIEKLATIYWFTVEFGLCKEGDSIKAYGAGLLSSFGELQYCL-S DKPKLLPLELEKTACQEYSVTEFQPLYYVAESFSDAKEKVRTFAATIPRPFSVRYDPYTQRVEVLDNT------------- ----------
1TOH	PWFPRKVSELDKC-----------DLDHPGFSDQVYRQRRKLIAEIAFQYKHGEPIPHVEYTAEEIATWKEVYVTLKGLYA THACREHLEGFQLLERYCGYREDSIPQLEDVSRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPE PDCCHELLGHVPMLADRTFAQFSQDIGLASLGASD-EEIEKLSTVYWFTVEFGLCKQNGELKAYGAGLLSSYGELLHSL-S EEPEVRAFDPDTAAVQPYQDQTYQPVYFVSESFNDAKDKLRNYASRIQRPFSVKFDPYTLAIDVLDSPHTIQRSLEGVQDE LHTLAHALS-
1LTZ	------------------------------------------------------PQPLDRYSAEDHATWATLYQRQCKLLP GRACDEFLEGLERLEV----DADRVPDFNKLNEKLMAATGWKIVAVPGLIPDDVFFEHLANRRFPVTWWLREPHQLDYLQE PDVFHDLFGHVPLLINPVFADYLEAYGKGGVKAKAlGALPMLARLYWYTVEFGLINTPAGMRIYGAGILSSKSESIYCLdS ASPNRVGFDLMRIMNTRYRIDTFQKTYFVIDSFKQ---------------------------------------------- ----------

REFERENCE	MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFF THLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQ FADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGF RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEK LATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVR NFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK
PSI	CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEECCCCCHHHHHHHHHHHHCCCCEEEEECCCCCCCCCCEEEE EECCCCCCHHHHHHHHHHCCCCEEEECCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHH HHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCC EEEECCCCCCHHHHHHHCCCCEECCCEEEECCCCCCCCCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCHHHHHH HHHHEEEEEEEEEECCCCCEEEECCCCCCCHHHHHHHHCCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHHHH HHHHHCCCCCEEEECCCCCEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHC
1PHZ	------------------GQETSYIEDNSNQNGAISLIFSLKEEVGALAKVLRLFEENDINLTHIESRPSRLNKDEYEFF TYLDKRTKPVLGSIIKSLRNDIGATVHELSRDKEKNTVPWFPRTIQELDRFANQI------LDADHPGFKDPVYRARRKQ FADIAYNYRHGQPIPRVEYTEEEKQTWGTVFRTLKALYKTHACYEHNHIFPLLEKYCGFREDNIPQLEDVSQFLQTCTGF RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEK LATIYWFTVEFGLCKEGDSIKAYGAGLLSSFGELQYCLSDKPKLLPLELEKTACQEYSVTEFQPLYYVAESFSDAKEKVR TFAATIPRPFSVRYDPYTQRVEVLDNT-------------------------
PSI	------------------CCCCCCCCCCCCCCCEEEEEEEECCCCCHHHHHHHHHHHCCCEEEEEECCCCCCCCCEEEEE EEECCCCCCCHHHHHHHHHCCCCCCEEECCCCCCCCCCCCCCCCHHHHHHHHHHH------CCCCCCCCCCHHHHHHHHH HHHHCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHCCCC EEEECCCCCCHHHHHHHHHCCCCCEECCCCCCCCCCCCCCCCHHHHHCCCCCCCCCHHHHHHHHHHHHHHCCCCHHHHHH HHHHEEEEEEEEEEEECCCCEEECCCCCCCCCCCCCCCCCCCCCCCCCHHHHHCCCCCCCCCCCCEEEECCHHHHHHHHH HHHHHCCCCCCCCCCCCCCEEEECCCC-------------------------

REFERENCE	PIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSR DFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFG LCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAAT
PSI	CCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCCEEEECCCCCCHH HHHHHCCCCEECCCEEEECCCCCCCCCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHEEEEEEEE EECCCCCEEEECCCCCCCHHHHHHHHCCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHHHHHHHHH
1LTZ	PQPLDRYSAEDHATWATLYQRQCKLLPGRACDEFLEGLERLEV----DADRVPDFNKLNEKLMAATGWKIVAVPGLIPDD VFFEHLANRRFPVTWWLREPHQLDYLQEPDVFHDLFGHVPLLINPVFADYLEAYGKGGVKAKAlGALPMLARLYWYTVEF GLINTPAGMRIYGAGILSSKSESIYCLdSASPNRVGFDLMRIMNTRYRIDTFQKTYFVIDSFKQLFDADFAPL
PSI	CCCCCCCCHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHCCEEEECCCCCCHHHHHH HHHCCCCCEEECCCCCCCCCCCCCCCHHHHHCCCCCCCCCHHHHHHHHHHHHHHCCCCCCCHHHHHHHHHEEEEEEEEEE CCCCEEEECCCCCCCCCCCCCCCCCCCCEEECCCHHHHHCCCCCCCCCCCCEEEECCHHHHHHHCCHHHHHHH

REFERENCE	GQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKIL RHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVE YMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGL AFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGD SIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYT QRIEVLDNTQQ
PSI	CCCCCCCCCCCCCCCCEEEEEECCCCCHHHHHHHHHHHHCCCCEEEEECCCCCCCCCCEEEEEECCCCCCHHHHHHHHHH CCCCEEEECCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHCCCCCCCCCCCC CCHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCCEEEECCCCCCHHHHHHHC CCCEECCCEEEECCCCCCCCCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHEEEEEEEEEECCCC CEEEECCCCCCCHHHHHHHHCCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHHHHHHHHHCCCCCEEEECCCC CEEEECCCHHH
1PHZ	GQETSYIEDNSNQNGAISLIFSLKEEVGALAKVLRLFEENDINLTHIESRPSRLNkDEYEFFTYLDKRTKPVLGSIIKSL RNDIGATVHELSRDKEKNTVPWFPRTIQELDRFANQI------LDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVE YTEEEKQTWGTVFRTLKALYKTHACYEHNHIFPLLEKYCGFREDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGL AFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPD-EYIEKLATIYWFTVEFGLCKEG DSIKAYGAGLLSSFGELQYCL-SDKPKLLPLELEKTACQEYSVTEFQPLYYVAESFSDAKEKVRTFAATIPRPFSVRYDP YTQRVEVLDNT
PSI	CCCCCCCCCCCCCCCEEEEEEEECCCCCHHHHHHHHHHHCCCEEEEEECCCCCCCCCEEEEEEEECCCCCCCHHHHHHHH HCCCCCCEEECCCCCCCCCCCCCCCCHHHHHHHHHHH------CCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCCCC CCHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHCCCCEEEECCCCCCHHHHHHHH HCCCCCEECCCCCCCCCCCCCCCCHHHHHCCCCCCCCCHHHHHHHHHHHHHHCCCCH-HHHHHHHHHEEEEEEEEEEEEC CCCEEECCCCCCCCCCCCCCC-CCCCCCCCCCHHHHHCCCCCCCCCCCCEEEECCHHHHHHHHHHHHHHCCCCCCCCCCC CCCEEEECCCC

REFERENCE	VPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSL YKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMY TPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYC LSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSI NSEIGILCSALQKIK
PSI	CCCCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHH HCCCHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCCEEEECCCCCCHHHHHHHCCCCEECCCEEEECCCCCCC CCCCCHHHHHHCCCCCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHEEEEEEEEEECCCCCEEEECCCCCCCHHHHHHH HCCCCCCCCCCHHHHHCCCCCCCCCCEEEEEECCHHHHHHHHHHHHHHCCCCCEEEECCCCCEEEECCCHHHHHHHHHHH HHHHHHHHHHHHHHC
1TOH	VPWFPRKVSELDKC-----------DLDHPGFSDQVYRQRRKLIAEIAFQYKHGEPIPHVEYTAEEIATWKEVYVTLKGL YATHACREHLEGFQLLERYCGYREDSIPQLEDVSRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMH SPEPDCCHELLGHVPMLADRTFAQFSQDIGLASLGASD-EEIEKLSTVYWFTVEFGLCKQNGELKAYGAGLLSSYGELLH SL-SEEPEVRAFDPDTAAVQPYQDQTYQPVYFVSESFNDAKDKLRNYASRIQRPFSVKFDPYTLAIDVLDSPHTIQRSLE GVQDELHTLAHALSA
PSI	CCCCCCCCCCCCCC-----------CCCCCCCCHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCHHHHHHHHHHHHHHHHH HHHCCCHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHCCCEEEECCCCCCHHHHHHHHHCCCCCCCCCCCCCCCCCC CCCCCHHHHHHCCCCCCCCHHHHHHHHHHHHHHCCCCHHHHHHHHCEEEEEEEEEEEEECCCCEECCCCCCCCCCHHCCC CCCCCCCCCCCHHHHHCCCCCCCCCCCEEEEECCHHHHHHHHHHHHHHHCCCCCCCCCCCCCCEECCCCHHHHHHHHHHH HHHHHHHHHHHHHHC

Difference between revisions of "Task 4: Homology based structure predictions"

Revision as of 22:19, 12 June 2011

Contents

Task description

Calculation of models

Overview of available homologous structures

Search

Template structure selection

Alignment Refinement

Homology modelling with Modeller

Homology modeling with Swissmodel

Standard workflow

Workflow with own alignment

Homology modelling with iTasser

Evaluation of the calculated models

Selection of the reference structures

Numeric evaluation of the calculated models

Modeller

Swissmodel

Automated Mode: Modelling with template structure 1phz_A (>60%)

Automated Mode: Modelling with template structure 1toh_A (>40%)

Automated Mode: Modelling with template structure 1ltz_A (<40%)

Alignment Mode: Modeling with adjusted alignment 1phz_A (>60%)

Alignment Mode: Modeling with adjusted alignment 1toh_A (>40%)

Alignment Mode: Modeling with adjusted alignment 1ltz_A (<40%)

iTasser

JigSaw 3D

Selection of models

1phz - sequence identity > 60 %

1toh - sequence identity > 40 %

1ltz - sequence identity < 40 %

Comparison to experimental structure

Modeller

Standard Workflow

Adjusted Alignment Workflow

Swissmodel

Standard Workflow

Adjusted Alignment Workflow

iTasser

Standard Workflow

Adjusted Alignment Workflow

Discussion

Navigation menu

Search