bitcoder
diff --git a/‎atest/robot/libdoc/html_output_from_xmlhtml.robot
Lines changed: 43 additions & 87 deletions b/‎atest/robot/libdoc/html_output_from_xmlhtml.robot
Lines changed: 43 additions & 87 deletions
diff --git a/‎src/robot/libdocpkg/htmlutils.py
Lines changed: 126 additions & 0 deletions b/‎src/robot/libdocpkg/htmlutils.py
Lines changed: 126 additions & 0 deletions
@@ -1,117 +1,73 @@
 *** Settings ***
 Resource          libdoc_resource.robot
-Suite Setup       Run Libdoc to XML:HTML and to HTML and Parse Model
-Test Template     Should Be Equal Multiline
+Suite Setup       Run Libdoc to XML:HTML and to HTML and Parse Models    ${TESTDATADIR}/module.py
+Test Template     Should Be Equal As Strings
 
 *** Keywords ***
-Run Libdoc to XML:HTML and to HTML and Parse Model
-    Run Libdoc And Set Output    --format XML:HTML ${TESTDATADIR}/module.py ${OUTXML} 
+Run Libdoc to XML:HTML and to HTML and Parse Models
+    [Arguments]    ${library_path}
+    Run Libdoc And Set Output    --format XML:HTML ${library_path} ${OUTXML}
     Run Libdoc And Parse Model From HTML    ${OUTXML}
-
-*** Comments ***
-This test suite will be changed with one of the next Tasks to contain a check for the roundtrip from library into XML then from XML to html.
+    Set Suite Variable    ${XML-MODEL}    ${MODEL}
+    Run Libdoc And Parse Model From HTML    ${library_path}
 
 *** Test Cases ***
 Name
-    ${MODEL}[name]          module
+    ${XML-MODEL}[name]    ${MODEL}[name]
 
 Documentation
-    ${MODEL}[doc]           <p>Module test library.</p>
+    ${XML-MODEL}[doc]    ${MODEL}[doc]
 
 Version
-    ${MODEL}[version]       0.1-alpha
-
-Generated
-    [Template]    Should Match Regexp
-    ${MODEL}[generated]     \\d{4}-\\d{2}-\\d{2} \\d{2}:\\d{2}:\\d{2}
+    ${XML-MODEL}[version]    ${MODEL}[version]
 
 Scope
-    ${MODEL}[scope]         GLOBAL
+    ${XML-MODEL}[scope]    ${MODEL}[scope]
 
 Named Args
-    [Template]    Should Be Equal
-    ${MODEL}[named_args]    ${True}
+    ${XML-MODEL}[named_args]    ${MODEL}[named_args]
 
 Inits
-    [Template]    Should Be Empty
-    ${MODEL}[inits]
+    ${XML-MODEL}[inits]    ${MODEL}[inits]
 
 Keyword Names
-    ${MODEL}[keywords][0][name]     Get Hello
-    ${MODEL}[keywords][1][name]     Keyword
-    ${MODEL}[keywords][13][name]    Set Name Using Robot Name Attribute
+    ${XML-MODEL}[keywords][0][name]    ${MODEL}[keywords][0][name]
+    ${XML-MODEL}[keywords][1][name]    ${MODEL}[keywords][1][name]
+    ${XML-MODEL}[keywords][13][name]    ${MODEL}[keywords][13][name]
 
 Keyword Arguments
-    [Template]    Should Be Equal As Strings
-    ${MODEL}[keywords][0][args]     []
-    ${MODEL}[keywords][1][args]     ['a1=d', '*a2']
-    ${MODEL}[keywords][6][args]     ['arg=hyv\\\\xe4']
-    ${MODEL}[keywords][10][args]    ['arg=hyvä']
-    ${MODEL}[keywords][12][args]    ['a=1', 'b=True', 'c=(1, 2, None)']
-    ${MODEL}[keywords][13][args]    ['a', 'b', '*args', '**kwargs']
+    ${XML-MODEL}[keywords][0][args]    ${MODEL}[keywords][0][args]
+    ${XML-MODEL}[keywords][1][args]    ${MODEL}[keywords][1][args]
+    ${XML-MODEL}[keywords][6][args]    ${MODEL}[keywords][6][args]
+    ${XML-MODEL}[keywords][10][args]    ${MODEL}[keywords][10][args]
+    ${XML-MODEL}[keywords][12][args]    ${MODEL}[keywords][12][args]
+    ${XML-MODEL}[keywords][13][args]    ${MODEL}[keywords][13][args]
 
 Embedded Arguments
-    [Template]    NONE
-    Should Be Equal    ${MODEL}[keywords][14][name]    Takes \${embedded} \${args}
-    Should Be Empty    ${MODEL}[keywords][14][args]
+    ${XML-MODEL}[keywords][14][name]    ${MODEL}[keywords][14][name]
+    ${XML-MODEL}[keywords][14][args]    ${MODEL}[keywords][14][args]
 
 Keyword Documentation
-    ${MODEL}[keywords][1][doc]
-    ...    <p>A keyword.</p>
-    ...    <p>See <a href="#Get%20Hello" class="name">get hello</a> for details.</p>
-    ${MODEL}[keywords][0][doc]
-    ...    <p>Get hello.</p>
-    ...    <p>See <a href="#Importing" class="name">importing</a> for explanation of nothing and <a href="#Introduction" class="name">introduction</a> for no more information.</p>
-    ${MODEL}[keywords][5][doc]
-    ...    <p>This is short doc. It can span multiple physical lines.</p>
-    ...    <p>This is body. It can naturally also contain multiple lines.</p>
-    ...    <p>And paragraphs.</p>
-
-Non-ASCII Keyword Documentation
-    ${MODEL}[keywords][8][doc]     <p>Hyvää yötä.</p>
-    ${MODEL}[keywords][11][doc]    <p>Hyvää yötä.</p>\n<p>Спасибо!</p>
+    ${XML-MODEL}[keywords][1][doc]    ${MODEL}[keywords][1][doc]
+    ${XML-MODEL}[keywords][0][doc]    ${MODEL}[keywords][0][doc]
+    ${XML-MODEL}[keywords][5][doc]    ${MODEL}[keywords][5][doc]
+    ${XML-MODEL}[keywords][8][doc]    ${MODEL}[keywords][8][doc]
+    ${XML-MODEL}[keywords][11][doc]    ${MODEL}[keywords][11][doc]
 
 Keyword Short Doc
-    ${MODEL}[keywords][1][shortdoc]     A keyword.
-    ${MODEL}[keywords][0][shortdoc]     Get hello.
-    ${MODEL}[keywords][8][shortdoc]     Hyvää yötä.
-    ${MODEL}[keywords][11][shortdoc]    Hyvää yötä.
-
-Keyword Short Doc Spanning Multiple Physical Lines
-    ${MODEL}[keywords][5][shortdoc]    This is short doc. It can span multiple physical lines.
+    ${XML-MODEL}[keywords][1][shortdoc]    ${MODEL}[keywords][1][shortdoc]
+    ${XML-MODEL}[keywords][0][shortdoc]    ${MODEL}[keywords][0][shortdoc]
+    ${XML-MODEL}[keywords][8][shortdoc]    ${MODEL}[keywords][8][shortdoc]
+    ${XML-MODEL}[keywords][11][shortdoc]    ${MODEL}[keywords][11][shortdoc]
+    ${XML-MODEL}[keywords][5][shortdoc]    ${MODEL}[keywords][5][shortdoc]
 
 Keyword tags
-    [Template]    Should Be Equal As Strings
-    ${MODEL}[keywords][1][tags]    []
-    ${MODEL}[keywords][2][tags]    ['1', 'one', 'yksi']
-    ${MODEL}[keywords][3][tags]    ['2', 'kaksi', 'two']
-    ${MODEL}[keywords][4][tags]    ['tag1', 'tag2']
-
-User keyword documentation formatting
-    [Setup]    Run Libdoc And Parse Model From HTML    ${TESTDATADIR}/resource.robot
-    ${MODEL}[keywords][0][doc]    <p>$\{CURDIR}</p>
-    ${MODEL}[keywords][1][doc]    <p><b>DEPRECATED</b> for some reason.</p>
-    ${MODEL}[keywords][2][doc]
-    ${MODEL}[keywords][10][doc]
-    ...    <p>Hyvää yötä.</p>
-    ...    <p>Спасибо!</p>
-    ${MODEL}[keywords][8][doc]
-    ...    <p>foo bar <a href="#kw" class="name">kw</a>.</p>
-    ...    <p>FIRST <span class="name">\${a1}</span> alskdj alskdjlajd askf laskdjf asldkfj alsdkfj alsdkfjasldkfj END</p>
-    ...    <p>SECOND askf laskdjf <i>asldkfj</i> alsdkfj alsdkfjasldkfj askf <b>laskdjf</b> END</p>
-    ...    <p>THIRD asldkfj <a href="#Introduction" class="name">introduction</a> alsdkfj <a href="http://foo.bar">http://foo.bar</a> END</p>
-    ...    <ul>
-    ...    <li>aaa</li>
-    ...    <li>bbb</li>
-    ...    </ul>
-    ...    <hr>
-    ...    <table border="1">
-    ...    <tr>
-    ...    <th>first</th>
-    ...    <th>second</th>
-    ...    </tr>
-    ...    <tr>
-    ...    <td>foo</td>
-    ...    <td>bar</td>
-    ...    </tr>
-    ...    </table>
+    ${XML-MODEL}[keywords][1][tags]    ${MODEL}[keywords][1][tags]
+    ${XML-MODEL}[keywords][2][tags]    ${MODEL}[keywords][2][tags]
+    ${XML-MODEL}[keywords][3][tags]    ${MODEL}[keywords][3][tags]
+    ${XML-MODEL}[keywords][4][tags]    ${MODEL}[keywords][4][tags]
+
+TOC doc
+    [Template]    None
+    Run Libdoc to XML:HTML and to HTML and Parse Models    ${TESTDATADIR}/TOCWithInitsAndKeywords.py
+    Should Be Equal As Strings    ${XML-MODEL}[doc]    ${MODEL}[doc]
@@ -0,0 +1,126 @@
+import re
+try:
+    from urllib import quote
+except ImportError:
+    from urllib.parse import quote
+
+from robot.errors import DataError
+from robot.utils import html_escape, html_format, NormalizedDict
+from robot.utils.htmlformatters import HeaderFormatter
+
+
+class DocFormatter(object):
+    _header_regexp = re.compile(r'<h([234])>(.+?)</h\1>')
+    _name_regexp = re.compile('`(.+?)`')
+
+    def __init__(self, keywords, introduction, doc_format='ROBOT'):
+        self._doc_to_html = DocToHtml(doc_format)
+        self._targets = self._get_targets(keywords, introduction,
+                                          robot_format=doc_format == 'ROBOT')
+
+    def _get_targets(self, keywords, introduction, robot_format):
+        targets = {
+            'introduction': 'Introduction',
+            'library introduction': 'Introduction',
+            'importing': 'Importing',
+            'library importing': 'Importing',
+            'keywords': 'Keywords'
+        }
+        for kw in keywords:
+            targets[kw.name] = kw.name
+        if robot_format:
+            for header in self._yield_header_targets(introduction):
+                targets[header] = header
+        return self._escape_and_encode_targets(targets)
+
+    def _yield_header_targets(self, introduction):
+        headers = HeaderFormatter()
+        for line in introduction.splitlines():
+            match = headers.match(line.strip())
+            if match:
+                yield match.group(2)
+
+    def _escape_and_encode_targets(self, targets):
+        return NormalizedDict((html_escape(key), self._encode_uri_component(value))
+                              for key, value in targets.items())
+
+    def _encode_uri_component(self, value):
+        # Emulates encodeURIComponent javascript function
+        return quote(value.encode('UTF-8'), safe="-_.!~*'()")
+
+    def html(self, doc, intro=False):
+        doc = self._doc_to_html(doc)
+        if intro:
+            doc = self._header_regexp.sub(r'<h\1 id="\2">\2</h\1>', doc)
+        return self._name_regexp.sub(self._link_keywords, doc)
+
+    def _link_keywords(self, match):
+        name = match.group(1)
+        if name in self._targets:
+            return '<a href="#%s" class="name">%s</a>' % (self._targets[name], name)
+        return '<span class="name">%s</span>' % name
+
+
+class DocToHtml(object):
+
+    def __init__(self, doc_format):
+        self._formatter = self._get_formatter(doc_format)
+
+    def _get_formatter(self, doc_format):
+        try:
+            return {'ROBOT': html_format,
+                    'TEXT': self._format_text,
+                    'HTML': lambda doc: doc,
+                    'REST': self._format_rest}[doc_format]
+        except KeyError:
+            raise DataError("Invalid documentation format '%s'." % doc_format)
+
+    def _format_text(self, doc):
+        return '<p style="white-space: pre-wrap">%s</p>' % html_escape(doc)
+
+    def _format_rest(self, doc):
+        try:
+            from docutils.core import publish_parts
+        except ImportError:
+            raise DataError("reST format requires 'docutils' module to be installed.")
+        parts = publish_parts(doc, writer_name='html',
+                              settings_overrides={'syntax_highlight': 'short'})
+        return parts['html_body']
+
+    def __call__(self, doc):
+        return self._formatter(doc)
+
+
+class HtmlToText(object):
+    html_tags = {
+        'b': '*',
+        'i': '_',
+        'strong': '*',
+        'em': '_',
+        'code': '``',
+        'div.*?': ''
+    }
+    html_chars = {
+        '<br */?>': '\n',
+        '&amp;': '&',
+        '&lt;': '<',
+        '&gt;': '>',
+        '&quot;': '"',
+        '&apos;': "'"
+    }
+
+    def get_shortdoc_from_html(self, doc):
+        match = re.search(r'<p.*?>(.*?)</?p>', doc, re.DOTALL)
+        if match:
+            doc = match.group(1)
+        doc = self.html_to_plain_text(doc)
+        return doc
+
+    def html_to_plain_text(self, doc):
+        for tag, repl in self.html_tags.items():
+            doc = re.sub(r'<%(tag)s>(.*?)</%(tag)s>' % {'tag': tag},
+                         r'%(repl)s\1%(repl)s' % {'repl': repl}, doc,
+                         flags=re.DOTALL)
+        for html, text in self.html_chars.items():
+            doc = re.sub(html, text, doc)
+        return doc