求教最近流行的竖排文字怎么提取真实内容?

求教最近流行的竖排文字怎么提取真实内容?

最近流行这个
┌─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
│享┆界┆族┆难┆版┆国┆律┆一┆言┆中┆自┆野┆反┆删┆事┆代┆,┆违│
│受┆第┆,┆道┆自┆家┆。┆部┆论┆国┆由┆蛮┆国┆除┆实┆庖┆网┆法│
│到┆一┆以┆中┆由┆中┆在┆保┆自┆至┆,┆的┆家┆的┆证┆法┆络┆只│
│基┆种┆1┆国┆排┆,┆世┆护┆由┆今┆才┆办┆法┆言┆明┆官┆警┆有│
│本┆族┆3┆人┆名┆中┆界┆新┆的┆没┆是┆法┆律┆论┆,┆的┆察┆法│
│的┆,┆亿┆是┆第┆国┆上┆闻┆法┆有┆违┆限┆的┆,┆那┆审┆有┆院│
│言┆居┆人┆低┆1┆的┆1┆自┆律┆一┆反┆制┆。┆并┆些┆判┆什┆有│
│论┆然┆口┆贱┆6┆言┆6┆由┆。┆部┆宪┆他┆他┆不┆被┆?┆么┆权│
│自┆不┆的┆的┆3┆论┆8┆的┆没┆保┆法┆人┆们┆是┆他┆很┆资┆宣│
│由┆配┆世┆种┆。┆出┆个┆法┆有┆护┆。┆的┆用┆违┆们┆多┆格┆判│
└─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘
这样竖排的文字对模式匹配很有挑战性啊!
由于无法判断里面的内容有没有非法的关键词,容易造成网监封杀
请各位高手帮忙研究下:
1 怎么样可以获得里面的内容呢?
2 怎么样可以替换里面的内容并仍保持以竖排格式输出?

我能想到的办法:split提取字符形成横排的文本再去判断.
看来也只能用万能的split了,哈哈
其实也没什么技术含量,切分后倒一下矩阵就行了,主要是要细心点,行列关系别搞错,试了几次终于搞定,哈哈哈!
原来有人研究这个啊,我这几天也做了一个,竖横文互转的。

http://shupai.perltest.cn
当成行列式处理~~~~
如果是特定的竖排文,处理我觉得不麻烦
但在www上面,首先你要区分哪些是竖排文,哪些是横排文
竖排文也可以有很多种表现形式。

因此这才是麻烦事