mirror of
https://github.com/erusev/parsedown.git
synced 2023-08-10 21:13:06 +03:00
Compare commits
20 Commits
1.0.0-rc.3
...
1.0.0
Author | SHA1 | Date | |
---|---|---|---|
2da10d277b | |||
532b5ede35 | |||
2bd2f81f4f | |||
e318e66de5 | |||
0820d0a607 | |||
b8d1cfe91a | |||
d85a233611 | |||
973d4a866d | |||
d19c2b6942 | |||
4dde57451d | |||
44686c4f1e | |||
db02ecf259 | |||
aa004d4595 | |||
1bb65457ed | |||
0c9a4af8ab | |||
cc94c1b584 | |||
e8d8801db4 | |||
521803cdcd | |||
0eb480324c | |||
7c78aff578 |
445
Parsedown.php
445
Parsedown.php
@ -29,6 +29,9 @@ class Parsedown
|
|||||||
|
|
||||||
function text($text)
|
function text($text)
|
||||||
{
|
{
|
||||||
|
# make sure no definitions are set
|
||||||
|
$this->Definitions = array();
|
||||||
|
|
||||||
# standardize line breaks
|
# standardize line breaks
|
||||||
$text = str_replace("\r\n", "\n", $text);
|
$text = str_replace("\r\n", "\n", $text);
|
||||||
$text = str_replace("\r", "\n", $text);
|
$text = str_replace("\r", "\n", $text);
|
||||||
@ -48,9 +51,6 @@ class Parsedown
|
|||||||
# trim line breaks
|
# trim line breaks
|
||||||
$markup = trim($markup, "\n");
|
$markup = trim($markup, "\n");
|
||||||
|
|
||||||
# clean up
|
|
||||||
$this->definitions = array();
|
|
||||||
|
|
||||||
return $markup;
|
return $markup;
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -58,6 +58,8 @@ class Parsedown
|
|||||||
# Setters
|
# Setters
|
||||||
#
|
#
|
||||||
|
|
||||||
|
private $breaksEnabled;
|
||||||
|
|
||||||
function setBreaksEnabled($breaksEnabled)
|
function setBreaksEnabled($breaksEnabled)
|
||||||
{
|
{
|
||||||
$this->breaksEnabled = $breaksEnabled;
|
$this->breaksEnabled = $breaksEnabled;
|
||||||
@ -65,13 +67,11 @@ class Parsedown
|
|||||||
return $this;
|
return $this;
|
||||||
}
|
}
|
||||||
|
|
||||||
private $breaksEnabled;
|
|
||||||
|
|
||||||
#
|
#
|
||||||
# Blocks
|
# Lines
|
||||||
#
|
#
|
||||||
|
|
||||||
protected $blockMarkers = array(
|
protected $BlockTypes = array(
|
||||||
'#' => array('Atx'),
|
'#' => array('Atx'),
|
||||||
'*' => array('Rule', 'List'),
|
'*' => array('Rule', 'List'),
|
||||||
'+' => array('List'),
|
'+' => array('List'),
|
||||||
@ -87,24 +87,31 @@ class Parsedown
|
|||||||
'8' => array('List'),
|
'8' => array('List'),
|
||||||
'9' => array('List'),
|
'9' => array('List'),
|
||||||
':' => array('Table'),
|
':' => array('Table'),
|
||||||
'<' => array('Markup'),
|
'<' => array('Comment', 'Markup'),
|
||||||
'=' => array('Setext'),
|
'=' => array('Setext'),
|
||||||
'>' => array('Quote'),
|
'>' => array('Quote'),
|
||||||
'[' => array('Reference'),
|
|
||||||
'_' => array('Rule'),
|
'_' => array('Rule'),
|
||||||
'`' => array('FencedCode'),
|
'`' => array('FencedCode'),
|
||||||
'|' => array('Table'),
|
'|' => array('Table'),
|
||||||
'~' => array('FencedCode'),
|
'~' => array('FencedCode'),
|
||||||
);
|
);
|
||||||
|
|
||||||
protected $definitionMarkers = array(
|
# ~
|
||||||
|
|
||||||
|
protected $DefinitionTypes = array(
|
||||||
'[' => array('Reference'),
|
'[' => array('Reference'),
|
||||||
);
|
);
|
||||||
|
|
||||||
|
# ~
|
||||||
|
|
||||||
protected $unmarkedBlockTypes = array(
|
protected $unmarkedBlockTypes = array(
|
||||||
'CodeBlock',
|
'CodeBlock',
|
||||||
);
|
);
|
||||||
|
|
||||||
|
#
|
||||||
|
# Blocks
|
||||||
|
#
|
||||||
|
|
||||||
private function lines(array $lines)
|
private function lines(array $lines)
|
||||||
{
|
{
|
||||||
$CurrentBlock = null;
|
$CurrentBlock = null;
|
||||||
@ -134,7 +141,7 @@ class Parsedown
|
|||||||
|
|
||||||
$Line = array('body' => $line, 'indent' => $indent, 'text' => $text);
|
$Line = array('body' => $line, 'indent' => $indent, 'text' => $text);
|
||||||
|
|
||||||
# Multiline block types define "addTo" methods.
|
# ~
|
||||||
|
|
||||||
if (isset($CurrentBlock['incomplete']))
|
if (isset($CurrentBlock['incomplete']))
|
||||||
{
|
{
|
||||||
@ -161,17 +168,15 @@ class Parsedown
|
|||||||
|
|
||||||
$marker = $text[0];
|
$marker = $text[0];
|
||||||
|
|
||||||
# Definitions
|
if (isset($this->DefinitionTypes[$marker]))
|
||||||
|
|
||||||
if (isset($this->definitionMarkers[$marker]))
|
|
||||||
{
|
{
|
||||||
foreach ($this->definitionMarkers[$marker] as $definitionType)
|
foreach ($this->DefinitionTypes[$marker] as $definitionType)
|
||||||
{
|
{
|
||||||
$Definition = $this->{'identify'.$definitionType}($Line, $CurrentBlock);
|
$Definition = $this->{'identify'.$definitionType}($Line, $CurrentBlock);
|
||||||
|
|
||||||
if (isset($Definition))
|
if (isset($Definition))
|
||||||
{
|
{
|
||||||
$this->definitions[$definitionType][$Definition['id']] = $Definition['data'];
|
$this->Definitions[$definitionType][$Definition['id']] = $Definition['data'];
|
||||||
|
|
||||||
continue 2;
|
continue 2;
|
||||||
}
|
}
|
||||||
@ -182,9 +187,9 @@ class Parsedown
|
|||||||
|
|
||||||
$blockTypes = $this->unmarkedBlockTypes;
|
$blockTypes = $this->unmarkedBlockTypes;
|
||||||
|
|
||||||
if (isset($this->blockMarkers[$marker]))
|
if (isset($this->BlockTypes[$marker]))
|
||||||
{
|
{
|
||||||
foreach ($this->blockMarkers[$marker] as $blockType)
|
foreach ($this->BlockTypes[$marker] as $blockType)
|
||||||
{
|
{
|
||||||
$blockTypes []= $blockType;
|
$blockTypes []= $blockType;
|
||||||
}
|
}
|
||||||
@ -195,23 +200,19 @@ class Parsedown
|
|||||||
|
|
||||||
foreach ($blockTypes as $blockType)
|
foreach ($blockTypes as $blockType)
|
||||||
{
|
{
|
||||||
# Block types define "identify" methods.
|
|
||||||
|
|
||||||
$Block = $this->{'identify'.$blockType}($Line, $CurrentBlock);
|
$Block = $this->{'identify'.$blockType}($Line, $CurrentBlock);
|
||||||
|
|
||||||
if (isset($Block))
|
if (isset($Block))
|
||||||
{
|
{
|
||||||
$Block['type'] = $blockType;
|
$Block['type'] = $blockType;
|
||||||
|
|
||||||
if ( ! isset($Block['identified'])) # »
|
if ( ! isset($Block['identified']))
|
||||||
{
|
{
|
||||||
$Elements []= $CurrentBlock['element'];
|
$Elements []= $CurrentBlock['element'];
|
||||||
|
|
||||||
$Block['identified'] = true;
|
$Block['identified'] = true;
|
||||||
}
|
}
|
||||||
|
|
||||||
# Multiline block types define "addTo" methods.
|
|
||||||
|
|
||||||
if (method_exists($this, 'addTo'.$blockType))
|
if (method_exists($this, 'addTo'.$blockType))
|
||||||
{
|
{
|
||||||
$Block['incomplete'] = true;
|
$Block['incomplete'] = true;
|
||||||
@ -225,7 +226,7 @@ class Parsedown
|
|||||||
|
|
||||||
# ~
|
# ~
|
||||||
|
|
||||||
if ($CurrentBlock['type'] === 'Paragraph' and ! isset($CurrentBlock['interrupted']))
|
if (isset($CurrentBlock) and ! isset($CurrentBlock['type']) and ! isset($CurrentBlock['interrupted']))
|
||||||
{
|
{
|
||||||
$CurrentBlock['element']['text'] .= "\n".$text;
|
$CurrentBlock['element']['text'] .= "\n".$text;
|
||||||
}
|
}
|
||||||
@ -233,15 +234,9 @@ class Parsedown
|
|||||||
{
|
{
|
||||||
$Elements []= $CurrentBlock['element'];
|
$Elements []= $CurrentBlock['element'];
|
||||||
|
|
||||||
$CurrentBlock = array(
|
$CurrentBlock = $this->buildParagraph($Line);
|
||||||
'type' => 'Paragraph',
|
|
||||||
'identified' => true,
|
$CurrentBlock['identified'] = true;
|
||||||
'element' => array(
|
|
||||||
'name' => 'p',
|
|
||||||
'text' => $text,
|
|
||||||
'handler' => 'line',
|
|
||||||
),
|
|
||||||
);
|
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -296,15 +291,22 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
|
|
||||||
#
|
#
|
||||||
# Rule
|
# Code
|
||||||
|
|
||||||
protected function identifyRule($Line)
|
protected function identifyCodeBlock($Line)
|
||||||
{
|
{
|
||||||
if (preg_match('/^(['.$Line['text'][0].'])([ ]{0,2}\1){2,}[ ]*$/', $Line['text']))
|
if ($Line['indent'] >= 4)
|
||||||
{
|
{
|
||||||
|
$text = substr($Line['body'], 4);
|
||||||
|
|
||||||
$Block = array(
|
$Block = array(
|
||||||
'element' => array(
|
'element' => array(
|
||||||
'name' => 'hr'
|
'name' => 'pre',
|
||||||
|
'handler' => 'element',
|
||||||
|
'text' => array(
|
||||||
|
'name' => 'code',
|
||||||
|
'text' => $text,
|
||||||
|
),
|
||||||
),
|
),
|
||||||
);
|
);
|
||||||
|
|
||||||
@ -312,104 +314,72 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
#
|
protected function addToCodeBlock($Line, $Block)
|
||||||
# Reference
|
|
||||||
|
|
||||||
protected function identifyReference($Line)
|
|
||||||
{
|
{
|
||||||
if (preg_match('/^\[(.+?)\]:[ ]*<?(\S+?)>?(?:[ ]+["\'(](.+)["\')])?[ ]*$/', $Line['text'], $matches))
|
if ($Line['indent'] >= 4)
|
||||||
{
|
{
|
||||||
$Definition = array(
|
if (isset($Block['interrupted']))
|
||||||
'id' => strtolower($matches[1]),
|
|
||||||
'data' => array(
|
|
||||||
'url' => $matches[2],
|
|
||||||
),
|
|
||||||
);
|
|
||||||
|
|
||||||
if (isset($matches[3]))
|
|
||||||
{
|
{
|
||||||
$Definition['data']['title'] = $matches[3];
|
$Block['element']['text']['text'] .= "\n";
|
||||||
|
|
||||||
|
unset($Block['interrupted']);
|
||||||
}
|
}
|
||||||
|
|
||||||
return $Definition;
|
$Block['element']['text']['text'] .= "\n";
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
#
|
$text = substr($Line['body'], 4);
|
||||||
# Setext
|
|
||||||
|
|
||||||
protected function identifySetext($Line, array $Block = null)
|
$Block['element']['text']['text'] .= $text;
|
||||||
{
|
|
||||||
if ( ! isset($Block) or $Block['type'] !== 'Paragraph' or isset($Block['interrupted']))
|
|
||||||
{
|
|
||||||
return;
|
|
||||||
}
|
|
||||||
|
|
||||||
if (chop($Line['text'], $Line['text'][0]) === '')
|
|
||||||
{
|
|
||||||
$Block['element']['name'] = $Line['text'][0] === '=' ? 'h1' : 'h2';
|
|
||||||
|
|
||||||
return $Block;
|
return $Block;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
#
|
protected function completeCodeBlock($Block)
|
||||||
# Markup
|
|
||||||
|
|
||||||
protected function identifyMarkup($Line)
|
|
||||||
{
|
{
|
||||||
if (preg_match('/^<(\w[\w\d]*)(?:[ ][^>\/]*)?(\/?)[ ]*>/', $Line['text'], $matches))
|
$text = $Block['element']['text']['text'];
|
||||||
{
|
|
||||||
if (in_array($matches[1], $this->textLevelElements))
|
|
||||||
{
|
|
||||||
return;
|
|
||||||
}
|
|
||||||
|
|
||||||
|
$text = htmlspecialchars($text, ENT_NOQUOTES, 'UTF-8');
|
||||||
|
|
||||||
|
$Block['element']['text']['text'] = $text;
|
||||||
|
|
||||||
|
return $Block;
|
||||||
|
}
|
||||||
|
|
||||||
|
#
|
||||||
|
# Comment
|
||||||
|
|
||||||
|
protected function identifyComment($Line)
|
||||||
|
{
|
||||||
|
if (isset($Line['text'][3]) and $Line['text'][3] === '-' and $Line['text'][2] === '-' and $Line['text'][1] === '!')
|
||||||
|
{
|
||||||
$Block = array(
|
$Block = array(
|
||||||
'element' => $Line['body'],
|
'element' => $Line['body'],
|
||||||
);
|
);
|
||||||
|
|
||||||
if ($matches[2] or $matches[1] === 'hr' or preg_match('/<\/'.$matches[1].'>[ ]*$/', $Line['text']))
|
if (preg_match('/-->$/', $Line['text']))
|
||||||
{
|
{
|
||||||
$Block['closed'] = true;
|
$Block['closed'] = true;
|
||||||
}
|
}
|
||||||
else
|
|
||||||
{
|
|
||||||
$Block['depth'] = 0;
|
|
||||||
$Block['start'] = '<'.$matches[1].'>';
|
|
||||||
$Block['end'] = '</'.$matches[1].'>';
|
|
||||||
}
|
|
||||||
|
|
||||||
return $Block;
|
return $Block;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function addToMarkup($Line, array $Block)
|
protected function addToComment($Line, array $Block)
|
||||||
{
|
{
|
||||||
if (isset($Block['closed']))
|
if (isset($Block['closed']))
|
||||||
{
|
{
|
||||||
return;
|
return;
|
||||||
}
|
}
|
||||||
|
|
||||||
if (stripos($Line['text'], $Block['start']) !== false) # opening tag
|
$Block['element'] .= "\n" . $Line['body'];
|
||||||
{
|
|
||||||
$Block['depth'] ++;
|
|
||||||
}
|
|
||||||
|
|
||||||
if (stripos($Line['text'], $Block['end']) !== false) # closing tag
|
if (preg_match('/-->$/', $Line['text']))
|
||||||
{
|
{
|
||||||
if ($Block['depth'] > 0)
|
$Block['closed'] = true;
|
||||||
{
|
|
||||||
$Block['depth'] --;
|
|
||||||
}
|
|
||||||
else
|
|
||||||
{
|
|
||||||
$Block['closed'] = true;
|
|
||||||
}
|
|
||||||
}
|
}
|
||||||
|
|
||||||
$Block['element'] .= "\n".$Line['body'];
|
|
||||||
|
|
||||||
return $Block;
|
return $Block;
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -418,7 +388,7 @@ class Parsedown
|
|||||||
|
|
||||||
protected function identifyFencedCode($Line)
|
protected function identifyFencedCode($Line)
|
||||||
{
|
{
|
||||||
if (preg_match('/^(['.$Line['text'][0].']{3,})[ ]*(\w+)?[ ]*$/', $Line['text'], $matches))
|
if (preg_match('/^(['.$Line['text'][0].']{3,})[ ]*([\w-]+)?[ ]*$/', $Line['text'], $matches))
|
||||||
{
|
{
|
||||||
$Element = array(
|
$Element = array(
|
||||||
'name' => 'code',
|
'name' => 'code',
|
||||||
@ -593,6 +563,8 @@ class Parsedown
|
|||||||
if (isset($Block['interrupted']))
|
if (isset($Block['interrupted']))
|
||||||
{
|
{
|
||||||
$Block['element']['text'] []= '';
|
$Block['element']['text'] []= '';
|
||||||
|
|
||||||
|
unset($Block['interrupted']);
|
||||||
}
|
}
|
||||||
|
|
||||||
$Block['element']['text'] []= $matches[1];
|
$Block['element']['text'] []= $matches[1];
|
||||||
@ -608,12 +580,106 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
#
|
||||||
|
# Rule
|
||||||
|
|
||||||
|
protected function identifyRule($Line)
|
||||||
|
{
|
||||||
|
if (preg_match('/^(['.$Line['text'][0].'])([ ]{0,2}\1){2,}[ ]*$/', $Line['text']))
|
||||||
|
{
|
||||||
|
$Block = array(
|
||||||
|
'element' => array(
|
||||||
|
'name' => 'hr'
|
||||||
|
),
|
||||||
|
);
|
||||||
|
|
||||||
|
return $Block;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
#
|
||||||
|
# Setext
|
||||||
|
|
||||||
|
protected function identifySetext($Line, array $Block = null)
|
||||||
|
{
|
||||||
|
if ( ! isset($Block) or isset($Block['type']) or isset($Block['interrupted']))
|
||||||
|
{
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (chop($Line['text'], $Line['text'][0]) === '')
|
||||||
|
{
|
||||||
|
$Block['element']['name'] = $Line['text'][0] === '=' ? 'h1' : 'h2';
|
||||||
|
|
||||||
|
return $Block;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
#
|
||||||
|
# Markup
|
||||||
|
|
||||||
|
protected function identifyMarkup($Line)
|
||||||
|
{
|
||||||
|
if (preg_match('/^<(\w[\w\d]*)(?:[ ][^>\/]*)?(\/?)[ ]*>/', $Line['text'], $matches))
|
||||||
|
{
|
||||||
|
if (in_array($matches[1], $this->textLevelElements))
|
||||||
|
{
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
$Block = array(
|
||||||
|
'element' => $Line['body'],
|
||||||
|
);
|
||||||
|
|
||||||
|
if ($matches[2] or $matches[1] === 'hr' or preg_match('/<\/'.$matches[1].'>[ ]*$/', $Line['text']))
|
||||||
|
{
|
||||||
|
$Block['closed'] = true;
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
$Block['depth'] = 0;
|
||||||
|
$Block['name'] = $matches[1];
|
||||||
|
}
|
||||||
|
|
||||||
|
return $Block;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
protected function addToMarkup($Line, array $Block)
|
||||||
|
{
|
||||||
|
if (isset($Block['closed']))
|
||||||
|
{
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (preg_match('/<'.$Block['name'].'([ ][^\/]+)?>/', $Line['text'])) # opening tag
|
||||||
|
{
|
||||||
|
$Block['depth'] ++;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (stripos($Line['text'], '</'.$Block['name'].'>') !== false) # closing tag
|
||||||
|
{
|
||||||
|
if ($Block['depth'] > 0)
|
||||||
|
{
|
||||||
|
$Block['depth'] --;
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
$Block['closed'] = true;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
$Block['element'] .= "\n".$Line['body'];
|
||||||
|
|
||||||
|
return $Block;
|
||||||
|
}
|
||||||
|
|
||||||
#
|
#
|
||||||
# Table
|
# Table
|
||||||
|
|
||||||
protected function identifyTable($Line, array $Block = null)
|
protected function identifyTable($Line, array $Block = null)
|
||||||
{
|
{
|
||||||
if ( ! isset($Block) or $Block['type'] !== 'Paragraph' or isset($Block['interrupted']))
|
if ( ! isset($Block) or isset($Block['type']) or isset($Block['interrupted']))
|
||||||
{
|
{
|
||||||
return;
|
return;
|
||||||
}
|
}
|
||||||
@ -764,57 +830,42 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
|
|
||||||
#
|
#
|
||||||
# Code
|
# Definitions
|
||||||
|
#
|
||||||
|
|
||||||
protected function identifyCodeBlock($Line)
|
protected function identifyReference($Line)
|
||||||
{
|
{
|
||||||
if ($Line['indent'] >= 4)
|
if (preg_match('/^\[(.+?)\]:[ ]*<?(\S+?)>?(?:[ ]+["\'(](.+)["\')])?[ ]*$/', $Line['text'], $matches))
|
||||||
{
|
{
|
||||||
$text = substr($Line['body'], 4);
|
$Definition = array(
|
||||||
|
'id' => strtolower($matches[1]),
|
||||||
$Block = array(
|
'data' => array(
|
||||||
'element' => array(
|
'url' => $matches[2],
|
||||||
'name' => 'pre',
|
|
||||||
'handler' => 'element',
|
|
||||||
'text' => array(
|
|
||||||
'name' => 'code',
|
|
||||||
'text' => $text,
|
|
||||||
),
|
|
||||||
),
|
),
|
||||||
);
|
);
|
||||||
|
|
||||||
return $Block;
|
if (isset($matches[3]))
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
protected function addToCodeBlock($Line, $Block)
|
|
||||||
{
|
|
||||||
if ($Line['indent'] >= 4)
|
|
||||||
{
|
|
||||||
if (isset($Block['interrupted']))
|
|
||||||
{
|
{
|
||||||
$Block['element']['text']['text'] .= "\n";
|
$Definition['data']['title'] = $matches[3];
|
||||||
|
|
||||||
unset($Block['interrupted']);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
$Block['element']['text']['text'] .= "\n";
|
return $Definition;
|
||||||
|
|
||||||
$text = substr($Line['body'], 4);
|
|
||||||
|
|
||||||
$Block['element']['text']['text'] .= $text;
|
|
||||||
|
|
||||||
return $Block;
|
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function completeCodeBlock($Block)
|
#
|
||||||
|
# ~
|
||||||
|
#
|
||||||
|
|
||||||
|
protected function buildParagraph($Line)
|
||||||
{
|
{
|
||||||
$text = $Block['element']['text']['text'];
|
$Block = array(
|
||||||
|
'element' => array(
|
||||||
$text = htmlspecialchars($text, ENT_NOQUOTES, 'UTF-8');
|
'name' => 'p',
|
||||||
|
'text' => $Line['text'],
|
||||||
$Block['element']['text']['text'] = $text;
|
'handler' => 'line',
|
||||||
|
),
|
||||||
|
);
|
||||||
|
|
||||||
return $Block;
|
return $Block;
|
||||||
}
|
}
|
||||||
@ -823,7 +874,7 @@ class Parsedown
|
|||||||
# ~
|
# ~
|
||||||
#
|
#
|
||||||
|
|
||||||
private function element(array $Element)
|
protected function element(array $Element)
|
||||||
{
|
{
|
||||||
$markup = '<'.$Element['name'];
|
$markup = '<'.$Element['name'];
|
||||||
|
|
||||||
@ -858,7 +909,7 @@ class Parsedown
|
|||||||
return $markup;
|
return $markup;
|
||||||
}
|
}
|
||||||
|
|
||||||
private function elements(array $Elements)
|
protected function elements(array $Elements)
|
||||||
{
|
{
|
||||||
$markup = '';
|
$markup = '';
|
||||||
|
|
||||||
@ -871,7 +922,7 @@ class Parsedown
|
|||||||
|
|
||||||
$markup .= "\n";
|
$markup .= "\n";
|
||||||
|
|
||||||
if (is_string($Element)) # because of markup
|
if (is_string($Element)) # because of Markup
|
||||||
{
|
{
|
||||||
$markup .= $Element;
|
$markup .= $Element;
|
||||||
|
|
||||||
@ -890,7 +941,7 @@ class Parsedown
|
|||||||
# Spans
|
# Spans
|
||||||
#
|
#
|
||||||
|
|
||||||
protected $spanMarkers = array(
|
protected $SpanTypes = array(
|
||||||
'!' => array('Link'), # ?
|
'!' => array('Link'), # ?
|
||||||
'&' => array('Ampersand'),
|
'&' => array('Ampersand'),
|
||||||
'*' => array('Emphasis'),
|
'*' => array('Emphasis'),
|
||||||
@ -903,8 +954,14 @@ class Parsedown
|
|||||||
'\\' => array('EscapeSequence'),
|
'\\' => array('EscapeSequence'),
|
||||||
);
|
);
|
||||||
|
|
||||||
|
# ~
|
||||||
|
|
||||||
protected $spanMarkerList = '*_!&[</`~\\';
|
protected $spanMarkerList = '*_!&[</`~\\';
|
||||||
|
|
||||||
|
#
|
||||||
|
# ~
|
||||||
|
#
|
||||||
|
|
||||||
public function line($text)
|
public function line($text)
|
||||||
{
|
{
|
||||||
$markup = '';
|
$markup = '';
|
||||||
@ -913,17 +970,19 @@ class Parsedown
|
|||||||
|
|
||||||
$markerPosition = 0;
|
$markerPosition = 0;
|
||||||
|
|
||||||
while ($markedExcerpt = strpbrk($remainder, $this->spanMarkerList))
|
while ($excerpt = strpbrk($remainder, $this->spanMarkerList))
|
||||||
{
|
{
|
||||||
$marker = $markedExcerpt[0];
|
$marker = $excerpt[0];
|
||||||
|
|
||||||
$markerPosition += strpos($remainder, $marker);
|
$markerPosition += strpos($remainder, $marker);
|
||||||
|
|
||||||
foreach ($this->spanMarkers[$marker] as $spanType)
|
$Excerpt = array('text' => $excerpt, 'context' => $text);
|
||||||
|
|
||||||
|
foreach ($this->SpanTypes[$marker] as $spanType)
|
||||||
{
|
{
|
||||||
$handler = 'identify'.$spanType;
|
$handler = 'identify'.$spanType;
|
||||||
|
|
||||||
$Span = $this->$handler($markedExcerpt, $text);
|
$Span = $this->$handler($Excerpt);
|
||||||
|
|
||||||
if ( ! isset($Span))
|
if ( ! isset($Span))
|
||||||
{
|
{
|
||||||
@ -948,7 +1007,7 @@ class Parsedown
|
|||||||
|
|
||||||
$markup .= $this->readPlainText($plainText);
|
$markup .= $this->readPlainText($plainText);
|
||||||
|
|
||||||
$markup .= isset($Span['element']) ? $this->element($Span['element']) : $Span['markup'];
|
$markup .= isset($Span['markup']) ? $Span['markup'] : $this->element($Span['element']);
|
||||||
|
|
||||||
$text = substr($text, $Span['position'] + $Span['extent']);
|
$text = substr($text, $Span['position'] + $Span['extent']);
|
||||||
|
|
||||||
@ -959,7 +1018,7 @@ class Parsedown
|
|||||||
continue 2;
|
continue 2;
|
||||||
}
|
}
|
||||||
|
|
||||||
$remainder = substr($markedExcerpt, 1);
|
$remainder = substr($excerpt, 1);
|
||||||
|
|
||||||
$markerPosition ++;
|
$markerPosition ++;
|
||||||
}
|
}
|
||||||
@ -973,14 +1032,14 @@ class Parsedown
|
|||||||
# ~
|
# ~
|
||||||
#
|
#
|
||||||
|
|
||||||
protected function identifyUrl($excerpt, $text)
|
protected function identifyUrl($Excerpt)
|
||||||
{
|
{
|
||||||
if ( ! isset($excerpt[1]) or $excerpt[1] !== '/')
|
if ( ! isset($Excerpt['text'][1]) or $Excerpt['text'][1] !== '/')
|
||||||
{
|
{
|
||||||
return;
|
return;
|
||||||
}
|
}
|
||||||
|
|
||||||
if (preg_match('/\bhttps?:[\/]{2}[^\s]+\b\/*/ui', $text, $matches, PREG_OFFSET_CAPTURE))
|
if (preg_match('/\bhttps?:[\/]{2}[^\s<]+\b\/*/ui', $Excerpt['context'], $matches, PREG_OFFSET_CAPTURE))
|
||||||
{
|
{
|
||||||
$url = str_replace(array('&', '<'), array('&', '<'), $matches[0][0]);
|
$url = str_replace(array('&', '<'), array('&', '<'), $matches[0][0]);
|
||||||
|
|
||||||
@ -998,9 +1057,9 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function identifyAmpersand($excerpt)
|
protected function identifyAmpersand($Excerpt)
|
||||||
{
|
{
|
||||||
if ( ! preg_match('/^&#?\w+;/', $excerpt))
|
if ( ! preg_match('/^&#?\w+;/', $Excerpt['text']))
|
||||||
{
|
{
|
||||||
return array(
|
return array(
|
||||||
'markup' => '&',
|
'markup' => '&',
|
||||||
@ -1009,14 +1068,14 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function identifyStrikethrough($excerpt)
|
protected function identifyStrikethrough($Excerpt)
|
||||||
{
|
{
|
||||||
if ( ! isset($excerpt[1]))
|
if ( ! isset($Excerpt['text'][1]))
|
||||||
{
|
{
|
||||||
return;
|
return;
|
||||||
}
|
}
|
||||||
|
|
||||||
if ($excerpt[1] === $excerpt[0] and preg_match('/^~~(?=\S)(.+?)(?<=\S)~~/', $excerpt, $matches))
|
if ($Excerpt['text'][1] === '~' and preg_match('/^~~(?=\S)(.+?)(?<=\S)~~/', $Excerpt['text'], $matches))
|
||||||
{
|
{
|
||||||
return array(
|
return array(
|
||||||
'extent' => strlen($matches[0]),
|
'extent' => strlen($matches[0]),
|
||||||
@ -1029,12 +1088,12 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function identifyEscapeSequence($excerpt)
|
protected function identifyEscapeSequence($Excerpt)
|
||||||
{
|
{
|
||||||
if (in_array($excerpt[1], $this->specialCharacters))
|
if (isset($Excerpt['text'][1]) and in_array($Excerpt['text'][1], $this->specialCharacters))
|
||||||
{
|
{
|
||||||
return array(
|
return array(
|
||||||
'markup' => $excerpt[1],
|
'markup' => $Excerpt['text'][1],
|
||||||
'extent' => 2,
|
'extent' => 2,
|
||||||
);
|
);
|
||||||
}
|
}
|
||||||
@ -1048,9 +1107,9 @@ class Parsedown
|
|||||||
);
|
);
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function identifyUrlTag($excerpt)
|
protected function identifyUrlTag($Excerpt)
|
||||||
{
|
{
|
||||||
if (strpos($excerpt, '>') !== false and preg_match('/^<(https?:[\/]{2}[^\s]+?)>/i', $excerpt, $matches))
|
if (strpos($Excerpt['text'], '>') !== false and preg_match('/^<(https?:[\/]{2}[^\s]+?)>/i', $Excerpt['text'], $matches))
|
||||||
{
|
{
|
||||||
$url = str_replace(array('&', '<'), array('&', '<'), $matches[1]);
|
$url = str_replace(array('&', '<'), array('&', '<'), $matches[1]);
|
||||||
|
|
||||||
@ -1067,9 +1126,9 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function identifyEmailTag($excerpt)
|
protected function identifyEmailTag($Excerpt)
|
||||||
{
|
{
|
||||||
if (strpos($excerpt, '>') !== false and preg_match('/<(\S+?@\S+?)>/', $excerpt, $matches))
|
if (strpos($Excerpt['text'], '>') !== false and preg_match('/^<(\S+?@\S+?)>/', $Excerpt['text'], $matches))
|
||||||
{
|
{
|
||||||
return array(
|
return array(
|
||||||
'extent' => strlen($matches[0]),
|
'extent' => strlen($matches[0]),
|
||||||
@ -1084,9 +1143,9 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function identifyTag($excerpt)
|
protected function identifyTag($Excerpt)
|
||||||
{
|
{
|
||||||
if (strpos($excerpt, '>') !== false and preg_match('/^<\/?\w.*?>/', $excerpt, $matches))
|
if (strpos($Excerpt['text'], '>') !== false and preg_match('/^<\/?\w.*?>/', $Excerpt['text'], $matches))
|
||||||
{
|
{
|
||||||
return array(
|
return array(
|
||||||
'markup' => $matches[0],
|
'markup' => $matches[0],
|
||||||
@ -1095,11 +1154,11 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function identifyInlineCode($excerpt)
|
protected function identifyInlineCode($Excerpt)
|
||||||
{
|
{
|
||||||
$marker = $excerpt[0];
|
$marker = $Excerpt['text'][0];
|
||||||
|
|
||||||
if (preg_match('/^('.$marker.'+)[ ]*(.+?)[ ]*(?<!'.$marker.')\1(?!'.$marker.')/', $excerpt, $matches))
|
if (preg_match('/^('.$marker.'+)[ ]*(.+?)[ ]*(?<!'.$marker.')\1(?!'.$marker.')/', $Excerpt['text'], $matches))
|
||||||
{
|
{
|
||||||
$text = $matches[2];
|
$text = $matches[2];
|
||||||
$text = htmlspecialchars($text, ENT_NOQUOTES, 'UTF-8');
|
$text = htmlspecialchars($text, ENT_NOQUOTES, 'UTF-8');
|
||||||
@ -1114,25 +1173,25 @@ class Parsedown
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function identifyLink($excerpt)
|
protected function identifyLink($Excerpt)
|
||||||
{
|
{
|
||||||
$extent = $excerpt[0] === '!' ? 1 : 0;
|
$extent = $Excerpt['text'][0] === '!' ? 1 : 0;
|
||||||
|
|
||||||
if (strpos($excerpt, ']') and preg_match('/\[((?:[^][]|(?R))*)\]/', $excerpt, $matches))
|
if (strpos($Excerpt['text'], ']') and preg_match('/\[((?:[^][]|(?R))*)\]/', $Excerpt['text'], $matches))
|
||||||
{
|
{
|
||||||
$Link = array('text' => $matches[1], 'label' => strtolower($matches[1]));
|
$Link = array('text' => $matches[1], 'label' => strtolower($matches[1]));
|
||||||
|
|
||||||
$extent += strlen($matches[0]);
|
$extent += strlen($matches[0]);
|
||||||
|
|
||||||
$substring = substr($excerpt, $extent);
|
$substring = substr($Excerpt['text'], $extent);
|
||||||
|
|
||||||
if (preg_match('/^\s*\[(.+?)\]/', $substring, $matches))
|
if (preg_match('/^\s*\[([^][]+)\]/', $substring, $matches))
|
||||||
{
|
{
|
||||||
$Link['label'] = strtolower($matches[1]);
|
$Link['label'] = strtolower($matches[1]);
|
||||||
|
|
||||||
if (isset($this->definitions['Reference'][$Link['label']]))
|
if (isset($this->Definitions['Reference'][$Link['label']]))
|
||||||
{
|
{
|
||||||
$Link += $this->definitions['Reference'][$Link['label']];
|
$Link += $this->Definitions['Reference'][$Link['label']];
|
||||||
|
|
||||||
$extent += strlen($matches[0]);
|
$extent += strlen($matches[0]);
|
||||||
}
|
}
|
||||||
@ -1141,9 +1200,9 @@ class Parsedown
|
|||||||
return;
|
return;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
elseif (isset($this->definitions['Reference'][$Link['label']]))
|
elseif (isset($this->Definitions['Reference'][$Link['label']]))
|
||||||
{
|
{
|
||||||
$Link += $this->definitions['Reference'][$Link['label']];
|
$Link += $this->Definitions['Reference'][$Link['label']];
|
||||||
|
|
||||||
if (preg_match('/^[ ]*\[\]/', $substring, $matches))
|
if (preg_match('/^[ ]*\[\]/', $substring, $matches))
|
||||||
{
|
{
|
||||||
@ -1173,7 +1232,7 @@ class Parsedown
|
|||||||
|
|
||||||
$url = str_replace(array('&', '<'), array('&', '<'), $Link['url']);
|
$url = str_replace(array('&', '<'), array('&', '<'), $Link['url']);
|
||||||
|
|
||||||
if ($excerpt[0] === '!')
|
if ($Excerpt['text'][0] === '!')
|
||||||
{
|
{
|
||||||
$Element = array(
|
$Element = array(
|
||||||
'name' => 'img',
|
'name' => 'img',
|
||||||
@ -1206,20 +1265,20 @@ class Parsedown
|
|||||||
);
|
);
|
||||||
}
|
}
|
||||||
|
|
||||||
protected function identifyEmphasis($excerpt)
|
protected function identifyEmphasis($Excerpt)
|
||||||
{
|
{
|
||||||
if ( ! isset($excerpt[1]))
|
if ( ! isset($Excerpt['text'][1]))
|
||||||
{
|
{
|
||||||
return;
|
return;
|
||||||
}
|
}
|
||||||
|
|
||||||
$marker = $excerpt[0];
|
$marker = $Excerpt['text'][0];
|
||||||
|
|
||||||
if ($excerpt[1] === $marker and preg_match($this->strongRegex[$marker], $excerpt, $matches))
|
if ($Excerpt['text'][1] === $marker and preg_match($this->StrongRegex[$marker], $Excerpt['text'], $matches))
|
||||||
{
|
{
|
||||||
$emphasis = 'strong';
|
$emphasis = 'strong';
|
||||||
}
|
}
|
||||||
elseif (preg_match($this->emRegex[$marker], $excerpt, $matches))
|
elseif (preg_match($this->EmRegex[$marker], $Excerpt['text'], $matches))
|
||||||
{
|
{
|
||||||
$emphasis = 'em';
|
$emphasis = 'em';
|
||||||
}
|
}
|
||||||
@ -1311,7 +1370,7 @@ class Parsedown
|
|||||||
# Fields
|
# Fields
|
||||||
#
|
#
|
||||||
|
|
||||||
protected $definitions;
|
protected $Definitions;
|
||||||
|
|
||||||
#
|
#
|
||||||
# Read-only
|
# Read-only
|
||||||
@ -1320,12 +1379,12 @@ class Parsedown
|
|||||||
'\\', '`', '*', '_', '{', '}', '[', ']', '(', ')', '>', '#', '+', '-', '.', '!',
|
'\\', '`', '*', '_', '{', '}', '[', ']', '(', ')', '>', '#', '+', '-', '.', '!',
|
||||||
);
|
);
|
||||||
|
|
||||||
protected $strongRegex = array(
|
protected $StrongRegex = array(
|
||||||
'*' => '/^[*]{2}((?:[^*]|[*][^*]*[*])+?)[*]{2}(?![*])/s',
|
'*' => '/^[*]{2}((?:[^*]|[*][^*]*[*])+?)[*]{2}(?![*])/s',
|
||||||
'_' => '/^__((?:[^_]|_[^_]*_)+?)__(?!_)/us',
|
'_' => '/^__((?:[^_]|_[^_]*_)+?)__(?!_)/us',
|
||||||
);
|
);
|
||||||
|
|
||||||
protected $emRegex = array(
|
protected $EmRegex = array(
|
||||||
'*' => '/^[*]((?:[^*]|[*][*][^*]+?[*][*])+?)[*](?![*])/s',
|
'*' => '/^[*]((?:[^*]|[*][*][^*]+?[*][*])+?)[*](?![*])/s',
|
||||||
'_' => '/^_((?:[^_]|__[^_]*__)+?)_(?!_)\b/us',
|
'_' => '/^_((?:[^_]|__[^_]*__)+?)_(?!_)\b/us',
|
||||||
);
|
);
|
||||||
@ -1333,12 +1392,12 @@ class Parsedown
|
|||||||
protected $textLevelElements = array(
|
protected $textLevelElements = array(
|
||||||
'a', 'br', 'bdo', 'abbr', 'blink', 'nextid', 'acronym', 'basefont',
|
'a', 'br', 'bdo', 'abbr', 'blink', 'nextid', 'acronym', 'basefont',
|
||||||
'b', 'em', 'big', 'cite', 'small', 'spacer', 'listing',
|
'b', 'em', 'big', 'cite', 'small', 'spacer', 'listing',
|
||||||
'i', 'rp', 'sub', 'code', 'strike', 'marquee',
|
'i', 'rp', 'del', 'code', 'strike', 'marquee',
|
||||||
'q', 'rt', 'sup', 'font', 'strong',
|
'q', 'rt', 'ins', 'font', 'strong',
|
||||||
's', 'tt', 'var', 'mark',
|
's', 'tt', 'sub', 'mark',
|
||||||
'u', 'xm', 'wbr', 'nobr',
|
'u', 'xm', 'sup', 'nobr',
|
||||||
'ruby',
|
'var', 'ruby',
|
||||||
'span',
|
'wbr', 'span',
|
||||||
'time',
|
'time',
|
||||||
);
|
);
|
||||||
}
|
}
|
||||||
|
5
test/data/HTML_Comment.html
Normal file
5
test/data/HTML_Comment.html
Normal file
@ -0,0 +1,5 @@
|
|||||||
|
<!-- single line -->
|
||||||
|
<p>paragraph</p>
|
||||||
|
<!--
|
||||||
|
multiline -->
|
||||||
|
<p>paragraph</p>
|
8
test/data/HTML_Comment.md
Normal file
8
test/data/HTML_Comment.md
Normal file
@ -0,0 +1,8 @@
|
|||||||
|
<!-- single line -->
|
||||||
|
|
||||||
|
paragraph
|
||||||
|
|
||||||
|
<!--
|
||||||
|
multiline -->
|
||||||
|
|
||||||
|
paragraph
|
@ -1,5 +1,8 @@
|
|||||||
<div>_content_</div>
|
<div>_content_</div>
|
||||||
<p>sparse:</p>
|
<p>sparse:</p>
|
||||||
<div>
|
<div>
|
||||||
|
<div class="inner">
|
||||||
_content_
|
_content_
|
||||||
</div>
|
</div>
|
||||||
|
</div>
|
||||||
|
<p>paragraph</p>
|
@ -3,5 +3,9 @@
|
|||||||
sparse:
|
sparse:
|
||||||
|
|
||||||
<div>
|
<div>
|
||||||
|
<div class="inner">
|
||||||
_content_
|
_content_
|
||||||
</div>
|
</div>
|
||||||
|
</div>
|
||||||
|
|
||||||
|
paragraph
|
@ -1,3 +1,4 @@
|
|||||||
<p>an <a href="http://example.com">implicit</a> reference link</p>
|
<p>an <a href="http://example.com">implicit</a> reference link</p>
|
||||||
<p>an <a href="http://example.com">implicit</a> reference link with an empty link definition</p>
|
<p>an <a href="http://example.com">implicit</a> reference link with an empty link definition</p>
|
||||||
|
<p>an <a href="http://example.com">implicit</a> reference link followed by <a href="http://cnn.com">another</a></p>
|
||||||
<p>an <a href="http://example.com" title="Example">explicit</a> reference link with a title</p>
|
<p>an <a href="http://example.com" title="Example">explicit</a> reference link with a title</p>
|
@ -4,6 +4,10 @@ an [implicit] reference link
|
|||||||
|
|
||||||
an [implicit][] reference link with an empty link definition
|
an [implicit][] reference link with an empty link definition
|
||||||
|
|
||||||
|
an [implicit][] reference link followed by [another][]
|
||||||
|
|
||||||
|
[another]: http://cnn.com
|
||||||
|
|
||||||
an [explicit][example] reference link with a title
|
an [explicit][example] reference link with a title
|
||||||
|
|
||||||
[example]: http://example.com "Example"
|
[example]: http://example.com "Example"
|
@ -1,4 +1,6 @@
|
|||||||
<blockquote>
|
<blockquote>
|
||||||
<p>quote
|
<p>quote
|
||||||
the rest of it</p>
|
the rest of it</p>
|
||||||
|
<p>another paragraph
|
||||||
|
the rest of it</p>
|
||||||
</blockquote>
|
</blockquote>
|
@ -1,2 +1,5 @@
|
|||||||
> quote
|
> quote
|
||||||
|
the rest of it
|
||||||
|
|
||||||
|
> another paragraph
|
||||||
the rest of it
|
the rest of it
|
@ -1,4 +1,5 @@
|
|||||||
<p>an <b>important</b> <a href=''>link</a></p>
|
<p>an <b>important</b> <a href=''>link</a></p>
|
||||||
<p>broken<br/>
|
<p>broken<br/>
|
||||||
line</p>
|
line</p>
|
||||||
<p><b>inline tag</b> at the beginning</p>
|
<p><b>inline tag</b> at the beginning</p>
|
||||||
|
<p><span><a href="http://example.com">http://example.com</a></span></p>
|
@ -3,4 +3,6 @@ an <b>important</b> <a href=''>link</a>
|
|||||||
broken<br/>
|
broken<br/>
|
||||||
line
|
line
|
||||||
|
|
||||||
<b>inline tag</b> at the beginning
|
<b>inline tag</b> at the beginning
|
||||||
|
|
||||||
|
<span>http://example.com</span>
|
Reference in New Issue
Block a user